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"Proteirte purifjge SR-p70" . 
Uinvention conceme de nouvelles sequences dacides nucieiques de la famille des 
genes suppresseurs de tumeurs apparentee avec le gene de la proteine p53, et les 
sequences proteiques correspondantes. 

L'invention conceme egalement les applications prophylactiques. therapeutiques et 
diagnostiques de celles-ci, notamment dans le domaine des pathologies liees aux 
phenomenes d'apoptose ou de transformation cellulaire. 

Les genes suppresseurs de tumeurs jouent un role clef dans la protection centre les 
phenomenes de cancerisation, et toute modification susceptible d'entrainer la perte 
de run de ces genes, son inactivation ou son dysfonctionnement, peut avoir un 
caractere oncogene, creant ainsi des conditions favorables au developpement d'un 
cancer. 

Les auteurs de la presente invention ont identifie les produits de transcription d'un 
nouveau gene ainsi que les proteines correspondantes. Ce gene SR-p70 est 
apparente au gene suppresseur de tumeur p53, dont I'activite anti-tumorale est liee a 
son activite de facteur de transcription et plus spedfiquement aux centrales exerces 
sur I'activite des genes Bax et Bd-2, instrumentaux dans les mecanismes de mort 
cellulaire. 

La presente invention est done relative d des proteines purifiees SR-p70, ou des 
fragments biologiquement actifs de celles-ci. 

Uinvention conceme egalement des sequences d'acides nucieiques isofees codant 
pour lesdites proteines ou leurs fragments biologiquement actifs et des 
oligonucleotides spedfiques obtenues & partir de ces sequences. 
Elle vise en outre les vecteurs de clonage et/ou d'expression contenant au moins 
rune des sequences nudeotidiques d6finies d-dessus, et les cellules hdtes transfec- 
tees par ces vecteurs de clonage et/ou d'expression dans des conditions permettant 
la replication et/ou ('expression de Tune desdites sequences nudeotidiques. 
Les methodes de production de proteines recombinantes SR-p70 ou de leurs frag- 
ments biologiquement actifs par les cellules hdtes transferees font egalement partie 
de ('invention. 

L'invention comprend egalement des anticorps ou des derives d'anticorps spedfiques 
des prolines d6finies ci-dessus. 

Elle vise en outre des methodes de detection des cancers, soit par la mesure de 
('accumulation des prolines SR-p70 dans les tumeurs selon des techniques 
d'immuno-histochimie, soit par la mise en evidence dans fe serum de patients 
d'auto-anticorps diriges centre ces proteines. 
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(.'invention concerne egalement tout inhibiteur ou activateur de I'activite du SR-p70 
par exemple d'interaction proteine-proteine faisant rntervenir le SR-p70. 
Elle concerne aussi des sequences oligonudeotidiques antisens, specifiques des 
sequences d'acides nudeiques ci-dessus, pouvant moduler in vivo I'expression du 
gene SR-p70. 

L'invention comprend enfin une methode de therapie genique dans laquelle des 
vecteurs tels que par exemple des vecteurs viraux inactives capables de transferer 
des sequences codantes pour une proteine selon l'invention sont rnjectes a des 
cellules d6ficientes pour cette proteine, a des fins de regulation des phenomenes 
d'apoptose ou de reversion de la transformation. 

La presente invention a pour objet un polypeptide purifie comprenant une sequence 
d'acides amines choisie parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) fa sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 
0 la sequence SEQ ID n° 13 ; 

g) la sequence SEQ ID n 9 15 ; 

h) la sequence SEQ ID n° 17 ; 

i) la sequence SEQ ID n° 19 ; 

j) toute sequence biologiquement active derivee de SEQ ID n° 2. SEQ ID n° 4, 
SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 
ou SEQ ID n° 19. 

Dans la description de l'invention, on utilise tes definitions suivantes : 

- proteine SR-p70 : un polypeptide comprenant une sequence d'acides amines 
choisie parmi les sequences SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, SEQ ID n° 8. 
SEQ ID n a 10, SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n* 19, ou tout 
fragment ou d6riv6 de celui-ci biologiquement actif. 

- ddrive : tout polypeptide variant du polypeptide de sequence SEQ ID n°2, SEQ 
ID n° 4, SEQ ID n° 6, SEQ ID n° 8. SEQ ID n° 10, SEQ ID n' 13, SEQ ID n° 15, SEQ 
ID n° 17 ou SEQ ID n° 19 ou toute moldcule resultant d f une modification de nature 
genetique et/ou chimique de la sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, 
SEQ ID n ft 8, SEQ ID n° 10. SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n° 
19 c'est-d-dire obtenue par mutation. d6l6tion, addition, substitution et/ou modification 
chimique d f un seui ou d'un nombre limits d'acides amines, ainsi que toute sequence 
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isoforme, c'est-a-dire une sequence identique a la sequence SEQ ID n° 2, SEQ ID 
n° 4, SEQ ID n° 6, SEQ ID n° 8, SEQ ID n° 10, SEQ ID n d 13, SEQ ID n 3 15. SEQ ID 
n° 17 ou SEQ ID n° 19 a Tun de ses fragments ou sequences modifiees, contenant 
un ou plusieurs acides amines sous la forme d'enantiomere D, lesdites sequences 
variantes, modifiees ou isoformes ayant conserve au moins Tune des proprietes les 
rendant biologiquement actives. 

- biologiquement actif : capable de se lier a rADN et/ou dexercer une activite de 
facteur de transcription et/ou de participer au controle du cycle cellulaire, de la 
differentiation et de I'apoptose et/ou capable d'etre reconnu par les anticorps 
specifiques du polypeptide de sequence SEQ ID n°2, SEQ ID n°4, SEQ ID n° 6, SEQ 
ID n° 8, SEQ ID n' 10. SEQ ID n°13. SEQ ID n° 15. SEQ ID n" 17 ou SEQ ID n° 19 
et/ou capable d'induire des anticorps qui reconnaissent ce polypeptide. 
La fabrication de derives peut avoir differents objectifs, dont en particutier celui 
d'augmenter i'affinite du polypeptide pour TADN ou son activite de facteur de 
transcription, celui d'ameliorer ses taux de production, d'augmenter sa resistance £ 
des proteases, de modifier ses activitts biologiques ou de lui conterer de nouvelles 
proprietes pharmaceutiques et/ou biologiques. 

Parmi les polypeptides de I'invention, on pretere le polypeptide d'origine humame, 
comprenant la sequence SEQ ID n° 6, SEQ ID n° 13. SEQ ID n°15. SEQ ID n°17 ou 
SEQ ID n°l9. Le polypeptide de 636 acides amines correspondant a la sequence 
SEQ ID n° 6 est identique a plus de 97 % au polypeptide de sequence SEQ ID n° 2. 
Le polypeptide de sequence SEQ ID n° 2 et celui de sequence SEQ ID n° 4 sont deux 
produits depression d'un meme gene, de meme pour les sequences SEQ ID n° 8 et 
SEQ ID n° 10 et pour les sequences SEQ ID n° 6, SEQ ID n°13, SEQ ID n° 15. SEQ 
lDn°17etSEQIDn°19. 

Comme il sera exptique dans les exemples, le polypeptide de sequence SEQ ID n° 4 
correspond d une terminaison prematuree du peptide de sequence SEQ ID n° 2. liee 
£ un epissage alternate du transcript codant pour le polypeptide de SEQ ID n° 2 le 
plus long (ARN messager) du g6ne correspondant De m£me chez rhumain. les 
polypeptides correspondant aux sequences SEQ ID n° 6, SEQ ID n° 13, SEQ ID n°15. 
SEQ ID n° 17 et SEQ ID n° 19 divergent dans leur composition au niveau des parties. 
N- et/ou -C terminaies et ce consecutif & des eptssages alternates d un meme 
transcript primaire. La sequence peptidique N-terminaie de la sequence SEQ ID n° 
10 est deletee. ce lie £ un epissage aitematif de son transcript codant 
Avantageusement i'invention vise un polypeptide correspondant au domaine de 
fixation sur rADN de Tun des polypeptides precedents. 
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Ce domains correspond a la sequence comprise entre le residu 110 et le residu 310 
pour les sequences SEQ ID n° 2 ou 6, et entre le residu 60 et le residu 260 pour la 
sequence SEQ ID n° 8. 

La presente invention a egalement pour objet des sequences d'acides nucleiques 
codant pour une proteine SR-p70 ou des fragments ou derives de celle-ci 
biologiquement actifs. 

Plus preferentiellement, I'invention a pour objet une sequence d'acides nucleiques 
isolee choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 

c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n*7 ; 

e) la sequence SEQ ID n°9 ; 

f) la sequence SEQ ID n° 1 1 ; 

g) la sequence SEQ ID n* 12 ; 

h) la sequence SEQ ID n° 14 ; 

i) la sequence SEQ ID n° 16 ; 
j) la sequence SEQ ID n° 18 ; 

k) les sequences d'acides nucleiques capables de s'hybrider specifiquement a 
la sequence SEQ ID n° 1 r SEQ ID n° 3, SEQ ID n° 5. SEQ ID n*7. SEQ ID n°9, 
SEQ ID n° 1 1. SEQ ID n° 12. SEQ ID n°14 ou SEQ ID n° 16 ou SEQ ID n° 18 ou a 
leurs sequences complementaires. ou de s'hybrider specifiquement a leurs 
sequences proxtmales ; 

I) les sequences d£riv6es des sequences a), b). c). d) t e) f 0. g). h). i) f j) ou k) du 
fait de la degenerescence du code gen6tique. 

Selon un mode de realisation preterm, I'invention a pour objet les sequences 
nucteotidiques SEQ ID n° 5 t SEQ ID n° 12. SEQ ID n° 14, SEQ ID n° 16 et SEQ ID n ft 
18 correspondant respectivement aux ADNc des proteines humaines des sequences 
SEQ ID n° 6, SEQ ID n° 13, SEQ ID n* 15 ( SEQ ID n° 17 et SEQ ID n° 19. 
Les differentes sequences nucldotidiques de I'invention peuvent etre dorigine 
artificielle ou non. II peut s'agir de sequences d'ADN ou d'ARN, obtenues par criblage 
de banques de sequences au moyen de sondes elaborees sur ta base des 
sequences SEQ ID n° 1, 3. 5, 7, 9. 11, 12. 14. 16 ou 18. De telles banques peuvent 
etre preparees par des techniques classiques de biologie moleculaire. connues de 
I'homme de Tart 
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Les sequences nucleotidiques selon ('invention peuvent egalement etre preparees par 
synthese chimique, ou encore par des methodes mixtes incluant la modification 
chimique ou enzymatique de sequences obtenues par criblage de banques. 
Ces sequences nucleotidiques permettent fa realisation de sondes nucleotidiques, 
capables de s'hybrider fortement et specifiquement avec une sequence d'acides nu- 
cleiques, d'un ADN genomique ou d'un ARN messager, codant pour un polypeptide 
selon r invention ou un fragment biologiquement actif de celui-ci. De telles sondes font 
egalement partie de 1'invention. Elles peuvent etre utilisees comme outil de diagnostic 
in vitro pour la detection, par des experiences d'hybridation, de transcripts specifiques 
des polypeptides de ('invention dans des echantillons biologiques ou pour la mise en 
evidence de syntheses aberrantes ou d'anomalies genetiques telles que la perte 
d'h6t£rozygotie ou ie rearrangement genetique, resultant d'un polymorphisme, de 
mutations ou d'un epissage different. 

Les sondes de 1'invention component au minimum 10 nucleotides, et au maximum 
component la totalitd de la sequence du gene SR-p70 ou de son ADNc contenu par 
exemple dans un cosmide. 

Parmt les sondes les plus courtes, c'est-a-dire d'environ 10 d 20 nucleotides, les 
conditions d'hybridation appropriees correspondent aux conditions stringentes 
usuellement utilisees par I'homme de metier. 

La temperature utifisee est de preference comprise entre T m -5° C a T m -30° C, de 
preference encore entre T m -5* C et T m -10° C, T m etant la temperature de fusion, 
temperature a laquelle 50 % des brins d'ADN appartes se separent. 
Lhybridation est de preference menee dans des solutions a force ionique etevee, 
telles que notamment des solutions 6 x SSC. 

De manure avantageuse. les conditions d'hybridation utilisees sont les suivantes : 

- temperature : 42* C t 

- tampon d'hybridation : 6 x SSC, 5 x Oenharts, 0,1 % SDS. 
telles que d£crites dans I'exemple III. 

Avantageusement, ces sondes sont representees par les oligonucleotides suivants ou 
leurs comptementaires : 

SEQ ID n° 20 : GCG AGC TGC CCT CGG AG 

SEQ ID n' 21 : GGT TCT GCA GGT GAG TCA G 

SEQ ID n° 22 : GCC ATG CCT GTC TAC AAG 

SEQ ID n« 23 : ACC AGC TGG TTG ACG GAG 

SEQ ID n* 24 : GTC AAC CAG CTG GTG GGC CAG 

SEQ ID n° 25 : GTG GAT CTC GGC CTC C 
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SEQ 


ID n° 


26 


: AGG CCG GCG TGG GGA AG 


SEQ 


IDn° 


27 


: CTT GGC GAT CTG GCA GTA G 


SEQ 


ID n* 


28 


: GCG GCC ACG ACC GTG AC 


SEQ 


ID n° 


29 


' GGC AGC TTG GGT CTC TGG 


SEQ 


ID n° 


30 ; 


CTG TAC GTC GGT GAC CCC 




in n° 
iu n 




■ TfA /^T/^ at r*Tr* nr*r* pt/** 
I LA 1 <J OA i UIL ubU UTC 


SEQ 


ID n' 


32: 


: AGG GGA CGC AGC GAA ACC 


SEQ 


!Dn° 


33: 


: CCA TCA GCT CCA GGC TCT C 


SEQ 


IDn° 


34 : 


CCA GGA CAG GCG CAG ATG 


SEQ 


IDn° 


35: 


GAT GAG GTG GCT GGC TGG A 


SEQ 


IDn° 


36: 


TGG TCA GGT TCT GCA GGT G 


SEQ 


IDn° 


37: 


CAC CTA CTC CAG GGA TGC 


SEQ 


IDn° 


38 : 


AGG AAA ATA GAA GCG TCA GTC 


SEQ 


ID n° 


39 : 


CAG GCC CAC TTG CCT GCC 


SEQ 


ID n° 


40: 


CTG TCC CCA AGC TGA TGA G 



Preferentiellement, les sondes de invention sont marquees, prealablement a leur 

utilisation. Pour cela. plusieurs techniques sont a la portee de I'homme du metier 

(marquage fluorescent, radioactif, chimioluminescent, enzymatique, etc). 

Les methodes de diagnostic in vitm dans lesquetles ces sondes nucleotidiques sont 

mises en oeuvre, sont incluses dans Pobjet de la presents invention. 

Ces methodes concernent par exemple la detection de syntheses anormales (ex. 

accumulation de produits de transcription) ou d'anomalies genetiques. telles que la 

perte d'heterozygotie et le rearrangement genetique, et les mutations ponctuelles au 

niveau des sequences nuddotidiques d*actdes nuc!6iques codant pour une proteine 

SR-p70, selon la definition donnee pr6c£demment 

Les sequences nucleotidiques de I'invention sont egalement utiles pour la fabrication 
et rutilisation d'amorces oligonucleotidiques pour des reactions de sequen9age ou 
d'amplification specifique selon la technique dite de PCR ou toute variante de celle-ci 
(Ligase Chain Reaction (LCR) t ...). 

Des paires d'amorces prefer^es sont constitutes par des amorces choisies sur les 
sequences nucleotidiques : SEQ ID n° 1 : sequence de singe de 2 874 nucleotides et 
SEQ IO n°5 : ADNc SR-p70a humain, notamment en amont du codon ATG d'initiation 
et en aval du codon TGA d*arr§t de traduction. 

Avantageusement, ces amorces sont representees par les couples suivants: 
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- couple n 3 1 : 

amorce sens : GCG AGC TGC CCT CGG AG (SEQ ID n° 20) 
amorce antisens : GGT TCT GCA GGT GAC TCA G (SEQ ID n° 21) 

■ couple n°2 : 

amorce sens : GCC ATG CCT GTC TAG AAG (SEQ ID n°22) 
amorce antisens : ACC AGC TGG TTG ACG GAG (SEQ ID n° 23) 

- couple n° 3 : 

amorce sens : GTC AAC CAG CTG GTG GGC CAG (SEQ ID n° 24) 
amorce antisens : GTG GAT CTC GGC CTC C (SEQ ID n° 25) 

- couple n° 4 : 

amorce sens : AGG CCG GCG TGG GGA AG (SEQ ID n° 26) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

- couple n* 5 : 

amorce sens : GCG GCC ACG ACC GTG A (SEQ ID n° 28) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n°29) 

* couple n° 6 : 

amorce sens : CTG TAC GTC GGT GAC CCC (SEQ ID n°30) 
amorce antisens : TCA GTG GAT CTC GGC CTC (SEQ ID n° 31) 

- couple n° 7 : 

amorce sens : AGG GGA CGC AGC GAA ACC (SEQ ID n a 32) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n° 29) 

- couple n° 8 : 

amorce sens : CCCCCCCCCCCCCCN (ou N est egal a G, A ou T) 
amorce antisens : CCA TCA GCT CCA GGC TCT C (SEQ ID n° 33) 

- couple n" 9 • 

amorce sens : CCCCCCCCCCCCCCN (ou N est egal a G, A ou T) 
amorce antisens : CCA GGA CAG GCG CAG ATG (SEQ fD n° 34) 
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- couple n° 10 : 

amorce sens : CCCCCCCCCCCCCCCN (oil N est egal a G, A ou T) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

- couple n° 11 ; 

amorce sens : CAC CTA CTC CAG GGA TGC (SEQ ID n° 37) 
amorce antisens : AGG AAA ATA GAA GCG TCA GTC (SEQ ID n° 38) 



- couple n° 12 : 

amorce sens : CAG GCC CAC TTG CCT GCC (SEQ ID n° 39) 
amorce antisens : CTG TCC CCA AGC TGA TGA G (SEQ ID n° 40) 

Ces amorces correspondent aux sequences allant respectivement : 

- du nucleotide n° 124 au nucleotide n° 140 sur SEQ ID n° 1 et du nucleotide n° 
1 au nucleotide n° 17 sur SEQ ID n°5 pour SEQ ID N° 20 

- du nucleotide n° 2280 au nucleotide n° 2262 sur SEQ ID n* 1 et du nucleotide 
n° 2156 au nucleotide 2138 sur SEQ ID n°5 pour SEQ ID N° 21 

- du nucleotide n° 684 au nucleotide n° 701 sur SEQ ID n° 1 pour SEQ ID N° 22 

- du nucleotide n° 1447 au nucleotide n° 1430 sur SEQ ID n° 1 et du nucleotide 
1324 au nucleotide 1307 sur SEQ ID n fl 5 pour SEQ ID N* 23 

- du nucleotide 1434 au nucleotide 1454 sur SEQ ID n°1 et du nucleotide 1311 
au nucieotide1331 sur SEQ ID n°5 pour SEQ ID n° 24 

- du nucleotide 2066 au nucleotide 2051 sur SEQ ID n°1 et du nucleotide 1940 
au nucleotide 1925 sur SEQ ID n°5 pour SEQ ID n°25. 

- du nucleotide 16 au nucleotide 32 sur SEQ ID n° 5 pour SEQ ID n* 26 

- du nucleotide 503 au nucleotide 485 sur SEQ ID n° 5 pour SEQ ID n° 27 

- du nucleotide 160 au nucleotide 176 sur SEQ ID n° 11 pour SEQ ID n° 28 

- du nucleotide 1993 au nucleotide 1976 sur SEQ ID n° 5 pour SEQ ID n° 29 

- du nucleotide 263 au nucleotide 280 sur SEQ ID n° 11 pour SEQ ID n* 30 

- du nucleotide 1943 au nucleotide 1926 sur SEQ ID n° 5 pour SEQ ID n° 31 

- du nucleotide 128 au nucleotide 145 sur la sequence nucl6otidique representee 
a fa figure 22 pour SEQ ID n° 32 

• du nucleotide 1167 au nucleotide 1149 sur SEQ ID n° 5 pour SEQ ID n ft 33 

- du nucleotide 928 au nucleotide 91 1 sur SEQ ID n° 5 pour SEQ ID n° 34 

- du nucleotide 677 au nucleotide 659 sur SEQ ID n° 5 pour SEQ ID n° 35 

- du nucleotide 1605 au nucleotide 1587 sur SEQ ID n° 5 pour SEQ ID n* 36 
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- du nucleotide 1 au nucleotide 18 sur la sequence nucleotidique representee a la 
figure 13 pour SEQ ID n* 37 

- du nucleotide 833 au nucleotide 813 sur la sequence nucleotidique representee 
a la figure 13 pour SEQ ID n" 38 

- du nucleotide 25 au nucleotide 42 sur la sequence nucleotidique representee a 
la figure 13 pour SEQ ID n° 39 

- du nucleotide 508 au nucleotide 488 sur la sequence nucleotidique representee 
a la figure 13 pour SEQ ID n" 40 



Les sequences nudeotidiques selon Tinvention peuvent avoir par ailleurs des 
utilisations en therapie genique. notamment pour le contrdle des phenomenes d'apop- 
tose et de reversion de la transformation. 

Les sequences nudeotidiques selon I'invention peuvent par ailleurs etre utilisees pour 
la production de proteines recombinantes SR-p70. selon ia definition qui a ete donnee 
a ce terme. 

Ces proteines peuvent etre produites a partir des sequences nudeotidiques definies 
d-dessus. selon des techniques de production de produits recombinants connues de 
I'homme du metier. Dans ce cas. la sequence nudeotidique utilisee est placee sous le 
controle de signaux permettant son expression dans un hote cellulaire. 
Un systeme efficace de production <fune proteine recombinante necessite de 
disposer d'un vecteur. par example d'origine plasmidique ou virale. et d une cellule 
hote compatible. 

L'hdte cellulaire peut etre choisi parmi des systemes procaryotes. comme les bacte- 
ries. ou eucaryotes. comme par example les levures. cellules dinsectes. CHO 
(cellules d'ovaires de hamster chinois) ou tout autre systeme avantageusement 
disponible. Un note cellulaire prefers pour (-expression des proteines de ( invention est 
constitue par la bacterie E. coll. notamment la souche MC 1061 (Clontec). 
Le vecteur doit comporter un promoteur. des signaux d'initiation et de terminaison de 
la traduction, ainsi que les regions appropriees de regulation de la transcription. II doit 
pouvoir etre maintenu de facon stable dans la cellule et peut eventuellement 
posseder des signaux particuliers spedfiant la secretion de la proteine traduite. 
Ces differents signaux de contrdle sont choisis en fonction de l'hdte cellulaire utilise. A 
cet effet. les sequences nudeotidiques selon I'invention peuvent etre inserees dans 
des vecteurs a replication autonome au sein de Ih6te choisi. ou des vecteurs 
integrattfs de I'h6te choisi. De tels vecteurs seront prepares selon les methodes 
couramment utilisees par I'homme du metier, et les clones en resultant peuvent etre 
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introduits dans un hote approprie par des methodes standard, telles que par exemple 
r&ectroporation. 

Les vecteurs de clonage et/ou d'expression contenant au moins rune des sequences 
nucleotidiques definies ci-dessus font egalement partie de la presente invention. 
Un vecteur de clonage et d'expression prefere est ie plasmide pSE1 qui comporte a la 
fois les elements necessaires pour son utilisation comme vecteur de clonage dans 
E.coli (origine de replication dans £. co// et gene de resistance a I'ampicilline, 
provenant du plasmide pTZ 18R), et comme vecteur d'expression dans les cellules 
animales (promoteur, intron, site de polyadenylation, origine de replication du virus 
SV40), ainsi que les elements permettant sa copie en simple brin dans un but de 
sequen^age (origine de replication du phage f1). 

Les caracteristiques de ce plasmide sont decrites dans la demande EP 0 506 574. 
Sa construction, ainsi que ('integration des ADNc provenant des sequences d'acides 
nucleiques de I'invention sont par ailleurs decrites dans les examples ci-apres. 
Selon un mode de realisation prefere, les prolines de ('invention sont sous forme de 
proteines de fusion, notamment sous forme de proteine fusionnee avec la glutathione 
S-transferase (GST). Un vecteur d'expression design* dans ce cas est represents par 
fe vecteur plasmidique pGEX-4T-3 (Pharmacia ref-27.4583). 

Uinvention vise en outre les cellules hdtes transferees par ces vecteurs precedents. 
Ces cellules peuvent 6tre obtenues par ('introduction dans des cellules hdtes d'une 
sequence nucleotidique inseree dans un vecteur tel que d6fini ci-dessus, puis la mise 
en culture desdites cellules dans des conditions permettant la replication et/ou 
('expression de la sequence nucleotidique transfectee. 

Ces cellules sont utilisables dans une methode de production d'un polypeptide 
recombinant de sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n° 6, SEQ ID n°8, 
SEQ ID n°10. SEQ ID n* 12. SEQ ID n° 14, SEQ ID n° 16 ou SEQ ID n° 18 ou tout 
fragment ou d6riv6 biologiquement actrf de ceiui-ci. 

La methode de production d'un polypeptide de I'invention sous forme recombinante 
est elle-m6me comprise dans la presente invention, et se caracterise en ce que I'on 
cultive les cellules transferees dans des conditions permettant (expression d'un 
polypeptide recombinant de sequence SEQ ID n° 2 ( SEQ ID n° 4, SEQ ID n° 6. SEQ 
ID n°8, SEQ ID n°10. SEQ ID n° 12. SEQ ID n° 14. SEQ ID n' 16 ou SEQ ID n° 18 ou 
de tout fragment ou ddrive biologiquement actif de celui-ci. et que Ton recupere ledit 
polypeptide recombinant 

Les precedes de purification utilises sont connus de I'homme du metier. Le 
polypeptide recombinant peut §tre purifid a partir de lysats et extraits celiulaires. du 
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sumageant du milieu de culture, par des methodes utilisees individuellement ou en 
combinaison. telles que le fractionnement, les methodes de chromatographie, les 
techniques d'immunoaffinite a I'aide d'anticorps mono ou polyclonaux specrfiques, etc. 
Une variante preferee consiste a produire un polypeptide recombinant fusionne a une 
proteine "porteuse" (proteine chimere)> L'avantage de ce systeme est qu'il permet une 
stabilisation et une diminution de ta proteolyse du produit recombinant, une 
augmentation de la solubilite au cours de la renaturation in vitro et/ou une simplifi- 
cation de la purification lorsque le partenaire de fusion possede une affinite pour un 
ligand specifique. 

Avantageusement, les polypeptides de rinvention sont fusionnes avec la glutathion 
S-transferase en position N-terminale (systeme "GST* Pharmacia). Le produit de 
fusion est dans ce cas detects et quantifie grace a I'activite enzymatique de la GST. 
Le reactif colorimetrique utilise est un accepteur de gluthation, substrat de la GST. Le 
produit recombinant est purifie sur un support de chromatographie auquel ont ete 
prealablement couplees des molecules de glutathion. 

Les anticorps mono ou polyclonaux capables de reconnaitre specifiquement une 
proteine SR-p70 selon la definition donnee precedemment font egalement partie de 
('invention. Des anticorps polyclonaux peuvent etre obtenus a partir du serum d'un 
animal immunisd contre la proteine, produite par exemple par recombinaison 
genetique suivant la methode decrite ci-dessus. selon les modes operators usuels. 
Les anticorps monoclonaux peuvent Stre obtenus selon la methode classique de 
culture d'hybridomes decrite par KShler et Milstein, Nature, 1975, 256, 495-497. 
Oes anticorps avantageux sont des anticorps diriges contre la region centrale 
comprise entre le residu 1 10 et le residu 310 pour les sequences SEQ ID n 9 2ou6 ou 
entre le residu 60 et le residu 260 pour la sequence SEQ ID n° 8. 

Les anticorps selon rinvention sont par exemple des anticorps chimeriques, des 

anticorps humanises, des fragments Fab et F(ab')2. lis peuvent egalement se 

presenter sous forme d'immunoconjugues ou d'anticorps marques. 

Par ailleurs, outre leur utilisation pour la purification des polypeptides recombinants, 

les anticorps de rinvention. en particulier les anticorps monoclonaux, peuvent 

egalement §tre utilises pour la detection de ces polypeptides dans un echantillon 

biologique. 

Us constituent ainsi un moyen d'analyse immunocytochimique ou 
immunohistochimique de rexpression de proteines SR-p70 sur des coupes de tissus 
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specifiques, par exemple par immunofluorescence, marquage a lor, 
immunoconjugues enzymatiques. 

lis permettent notamment de mettre en evidence une accumulation anormaie de 
proteines SR-p70 dans certains tissus ou pretevements biologiques, ce qui tes rend 
utiles pour ta detection des cancers ou le suivi de revolution ou de la remission de 
cancers preexistants. 

Plus generalement, tes anticorps de ('invention peuvent §tre avantageusement mis en 
oeuvre dans toute situation ou ('expression d'une proteine SR-p70 doit etre observee. 
L'invention conceme done egalement un precede de diagnostic in vitro de pathologies 
correldes £ une expression ou une accumulation anormaie de proteines SR-p70. 
notamment les phenomenes de cancerisation, a partir d'un prelevement biologique, 
caracterise en ce que Ton met en contact au moins un anticorps de ('invention avec 
ledit prelevement biologique, dans des conditions pemnettant la formation eventuelle 
de complexes immunologiques specifiques entre une proteine SR-p70 et le ou lesdits 
anticorps et en ce que Ton detecte les complexes immunologiques specifiques even- 
tuellement formes. 

L'invention conceme egalement un kit pour le diagnostic in vitro d'une expression ou 
une accumulation anormaie de proteines SR-p70 dans un prelevement biologique 
et/ou pour la mesure du taux d'expression de celle-ci dans ledit prelevement compre- 
nant : 

- au moins un anticorps spedfique d'une proteine SR-p70 f eventuellement fixe 
sur un support 

- des moyens de revelation de la formation de complexes antigen es/anticorps 
specifiques entre une proteine SR*p70 et ledit anticorps et/ou des moyens de 
quantification de ces complexes. 

L'invention vise egalement une methode de diagnostic precoce de la formation des 
tumeurs. par la mise en evidence dans le serum d'un individu, d'auto-anticorps diriges 
contre une proteine SR-p70. 

Une telle methode de diagnostic precoce est caracterisee en ce que Ton met en 
contact un echantillon de $6ojm pr6lev£ chez un individu avec un polypeptide de 
l'invention, eventuellement fix6 sur un support, dans des conditions pemnettant la 
formation de complexes immunologiques specifiques entre ledit polypeptide et les 
auto-anticorps eventuellement presents dans Techantillon de serum, et en ce que Ton 
detecte les complexes immunologiques specifiques eventuellement formes. 
L'invention a egalement pour objet une methode de determination d'une variability 
alielique, d'une mutation, d'une deletion, d'une insertion, d'une perte d'heterozygotie 
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ou d'une anomalie genetique du gene SR-p70, pouvant Stre impliquees dans des 
pathologies caracterisee en ce qu'elle utilise au moins une sequence nucieotidique 
decrite ci-dessus. Parmi les methodes de determination tfune variability alleiique. 
d une mutation, d'une deletion, d'une insertion, d'une perte d'heterozygotie ou d'une 
anomalie genetique du gene SR-p70, on prefere la methode caracterisee en ce 
qu'elle comprend au moins une etape d'ampiification par PCR de la sequence 
nucleique able du SR-p70 susceptible de presenter un polymorphisme, une mutation, 
une deletion ou une insertion a ('aide de couple d'amorces de sequences 
nucieotidiques definies ci-dessus, une etape au cours de laquelle on procede au 
traitement des produits amplifies a I'aide d'enzyme de restriction approprie et une 
etape au cours de laquelle on procede a la detection ou au dosage dau moins Tun 
des produits de la reaction enzymatique. 

L'invention comprend egalement des compositions pharmaceutiques comprenant 
comme principe actif un polypeptide repondant aux definitions precedentes. prefe- 
rentiellement sous forme soluble, associe a un vehicule pharmaceutiquement 
acceptable. 

De telles compositions offrent une nouvelle approche pour traiter les phenomenes de 
cancerisation au niveau du controle de la multiplication et la differentiation cellulaire. 
Preferentiellement, ces compositions peuvent Stre adminrstrees par voie systemique, 
de preference par voie intraveineuse, par voie intramusculaire, intradermique ou par 
voie orale. 

Leurs modes d'administration, posologies et formes galeniques optimaux peuvent £tre 
determines seton les criteres generalement pris en compte dans I'etablissement d'un 
traitement therapeutique adapt© a un patient comme par exemple l'£ge ou le poids 
corporel du patient la gravity de son 6tat general, la tolerance au traitement et les 
effets secondaires constates, etc 

L'invention comprend enfin une methode de therapie g6nique dans laquelle des 
sequences nucieotidiques codant pour une proline SR-p70 sont transferees a des 
cellules cibles par le biais de vecteurs viraux inactives. 

D'autres caracteristiques et a vantages de ('invention apparaissent dans la suite de la 
description avec les exemples et les figures dont les legendes sont representees ci- 
apres. 
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LEGENDE DES FIGURES 

Figure 1 : Comparaison nucieique de i'ADNc du SR-p70a de singe (correspondant 
a SEQ ID n°1) avec la sequence nucieique de i'ADNc de p53 de singe. 

Figure 2 : Comparaison proteique de SR-p70a de singe avec Ja proteine p53 de 
singe (sw : p53-cerae). 
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Figure 3 : Comparaison de la sequence nucieique de I'ADNc de SR-p70a et b de 
singe (correspondant respectivement a SEQ ID n° 1 et SEQ ID n° 3). 

Figure 4 : Sequence nucieique et sequence proteique deduite de SR-p70a de 
singe. 

Figure 5 : Sequence nucieique parte! le et sequence proteique deduite complete 
de 

SR*p70b de singe. 

Figure 6 : Sequence nucieique partielle et sequence proteique complete deduite 
de 

SR-p70a humain (correspondant a SEQ ID n° 5). 

Figure 7 : Sequence nucieique partielle et sequence proteique deduite complete 
de 

SR-p70c de souris (correspondant a SEQ ID n° 7). 

Figure 8 : Sequence nucieique partielle et sequence proteique deduite partielle de 
SR-p70a de souris (correspondant a SEQ ID n° 9). 

Figure 9 : Multiatignement des proteines deduites des ADNc SR-p70 de singe 
(a et b), humain (a) et de souris (a et c). 



Figure 10a : Immunoempreinte de la proteine SR-p70. 
35 Figure 10b : Detection de la proteine endogene SR-p70. 
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Figure 1 1 : Localisation chromosomique du gene SR-p70 humain. Le signal apparait 
sur le chromosome 1, dans la region p36. 

Figure 12: Structure genomique du gene SR-p70 et comparaison avec celle du 
gene p53. Les sequences proteiques humaines du SR-p70a (ligne du 
haut de Talignement) et de la p53 (ligne du bas) sont morcelees en 
peptides en fonction des exons respectifs a partir desquels ils sont 
codes. Les chiffres au niveau des fleches correspondent a la 
numerotation des exons correspondants. 

Figure 13: Sequence genomique humaine du SR-p70 depuis le 3* de Tintron 1 
jusqu'au 5 f de I'exon 3. Les introns sont encadres. Aux positions 123 et 
133, sont localisees deux positions nucleiques variables (G -> A en 123 
et C -> T en 133). Les sites de restriction de (enzyme Styl sont 
soulignes (position 130 dans le cas ou it y a presence d'un T au lieu d'un 
C a la position 133, position 542 et position 610). Les filches 
positionnent les amorces nucleiques utilises dans Texemple XI. 

Figure 14 : Comparaison nucldique du 5* des ADNc humains du SR-p70d et du 
SR-p70a. 



Multialignement des sequences nucleiques correspondant au SR-p70 
humain a, b. d, e, et f. 



Figure 16 : Multf-alignement des proteines deduites des ADNc SR-p70 humains (a, 
b t d, e et f). 

Figure 17 : S6quence nudeique partielle et sequence proteique d*duite partielle du 
SR-p70a humain. Les deux bases en caracteres gras correspondent a 
deux positions variables (voir figure 6). Cette sequence presente une 
region 5' non codante plus compete que celle presentee dans ta figure 
6. 

Figure 18 : Analyse des transcrits SR-p70a aprts amplification par PCR. 

piste M : marqueurs de poids moteculaires "1 kb ladder (GIBCO-BRL) 
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piste 1 : lignee HT29 
piste 3 : lignee SK-N-AS 
piste 5 : lignee UMR-32 
piste 7 : lignee U-373 MG 
piste 9 : lignee SW 480 
piste 11 : lignee CHP 212 
piste 13 : lignee SK-N-MC 



pistes 2. 4, 6, 8, 10, 12, 14 : temoins negatifs correspondent aux pistes 
1, 3. 5, 7, 9, 11 et 13 respectivement (absence de transcriptase inverse 
dans la reaction RT-PCR). 



Figure 19 : A : Analyse par electrophorese sur gel d'agarose des fragments 
genomiques amplifies par PGR (depuis le 3' de I'intron 1 jusqiTau 
15 5 1 de I'exon 3). La numerotation des pistes correspond a la 

numerotation de I'echantillonnage temoin. Piste M : marqueurs de 
poids moleculaires ( H 1 kb ladder 11 ). 
B : Analyse identique d cede de la parte A apres une digestion par 
Tenzyme de restriction Styl des mdmes echantillons. 

20 

Figure 20 : Representation schematique avec una carte de restriction partielle du 
plasmide pCDNA3 contenant le SR-p70a humain 
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EXEMPLE I 

Clonage de I'ADNc du SR-p70 de cellules COS-3. 

1. Culture des cellules COS-3 

Les cellules COS-3 (cellules de rein de singe vert d'Afrique transformees par 
I'antigene T du virus SV 40) sont cultivees dans le milieu DM EM (GIBCO-BRL refe- 
rence 41 965-047) contenant 2 mM de L-glutamine et supplements avec 50 mg/l de 
gentamycine et de 5 % de serum de bovin foetal (GIBCO-BRL reference 10231-074) 
jusqu'a semi-confluence. 

2. Preparation de I'ARN messager 
a) extraction de TARN messager 

Les cellules sont recuperees de la fa^on suivante : 

- les cellules adherentes sont lavees deux fois avec du tampon PBS (phosphate 
buffered saline, reference 04104040-GIBCO-BRL) puis grattees avec un grattoir 
en caoutchouc et centrifugees. 
Le culot cellulaire est mis en suspension dans le tampon de lyse de composition 
suivante : guanidine-thiocyanate 4M ; citrate de sodium 25mM pH 7 ; sarcosyl 0,5 
% ; p-mercaptoethanol 0,1 M. La suspension est soniquee a I'aide d un sonrcateur 
Ultra-Turrax n* 231256(Janke et Kundel) a puissance maximale pendant une 
minute. On ajoute de ('acetate de sodium pH 4 jusqu'a 0.2 M. La solution est 
extraite avec un volume d'un melange phenol/chloroforme (v/v ; 5/1). On precipite 
a -20°C TARN contenu dans la phase aqueuse a I'aide d un volume d'isopropanol. 
Le culot est resuspendu dans le tampon de lyse. La solution est a nouveau extraite 
avec un melange phenol/chloroforme et I'ARN est precipite avec de l isopropanol 
Apres lavage du culot avec de I'ethanol 70 % puis 100 %, I'ARN est resuspendu 
dans de Teau. 
b) Purification de la fraction poly A* de I'ARN 

La purification de la fraction poly A* de I'ARN est reahsee a I'aide du kit Dynabeads 
oligo (dT)„ de OYNAL (reference 610.05) suivant le protocole preconise par le 
fabricant Le principe est base sur rutilisation de billes polystyrene super- 
paramagnetique sur lesqueJIes est attache un oligonucleotide poly(dT) 25 . La frac- 
tion poly A* de I'ARN est hybridee sur I'oligofdT)* couple aux billes que Von piege 
sur un support magnetique. 
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3. Constitution de fa banque d'ADN complementaire 

a) preparation de I'ADN complementaire 

A partir de 0,5 ng des ARN-poly A* de cellules COS-3 obtenus a Tissue de I'etape 
2, on prepare I'ADN complementaire simple-brin marque au "P.dCTP (I'ADN 
complementaire obtenu presente une activite specifique de 3000 dpm/ng) avec 
I'amorce synthetique de sequence suivante (comprenant un site BamHI) : 
5'<GATCCGGGCC CT H I I I I I I TTT<3' 

dans un volume de 30 ul de tampon de composition : Tris HCI 50 mM pH 8,3, 
MgCf 2 6 mM, DTT 10 mM, KCI 40 mM, contenant 0,5 mM de chacun des 
desoxynucleotides triphosphates. 30jiCi de dCTP a 32 P et 30 U de RNasin (prome- 
ga). Apres une heure d'incubation a 37°C, puis 10 minutes a 50°C. puis de 
nouveau 10 minutes a 37°C. avec 200 unites de I'enzyme transcriptase inverse 
RNase H" (GIBCO-BRL reference B064A), on ajoute 4 ul d'EOTA. 

b) Hydrolyse alcaline de la matrice ARN 

On ajoute 6 d'une solution de NaOH 2N, puis on incube pendant 5 minutes a 
65° C. 

c) Purification sur colonne sephacryt S400 

Afin d'eliminer ramorce synthetique, on purifie I'ADN complementaire sur une 
colonne de 1 ml de sephacryt S400 (Pharmacia), equilibria dans du tampon TE. 
Les deux premieres fractions radioactives sont regroupees et precipitees avec 
1/10 de volume d'une solution d'acetate d'ammonium 10 M et 2.5 volumes 
d ethanol, ceci aprds une extraction, avec un volume de chloroforme, 

d) Addition homopolymerique de dG 

On allonge I'ADN complementaire en 3* avec une "queue" de dG avec 20 unites de 
I'enzyme terminate transferase (Pharmacia 27073001). On incube dans 20 \i\ de 
tampon de composition : Tris HCI 30 mM pH 7,6 ; chlorure de cobalt 1mM. acide 
cacodylique 140 mM, DTT 0 ( 1mM ( dGTP 1 mM, pendant 15 minutes a 37°C. puis 
on ajoute 2 >d d'EDTA 0.5 M. 

e) On repete a nouveau les Stapes b) et c) 

f) Appariement du vecteur de clonage pSE1 (EP 506 574) et de I'ADN 
complementaire en presence de I'adaptateur. 

On centrifuge, le culot est dissous dans 33 pi de tampon TE. on ajoute 5 ul (125 
ng) de vecteur de clonage pSE1, 1 ^1(120 ng) de I'adaptateur de sequence sui- 
vante (comprenant un site Apal) : 
5'AAAAAAAAAAAAAGGGCCCG3\ 



WO 97/28186 



PCT/FR97/00214 



19 

10 ni d'une solution de NaCI 200 mM, on incube pendant 5 minutes a 65°C puis 
on laisse refroidirle melange reactionnel jusqu'a temperature ambiante. 

g) Ligation 

On ligue le vecteur de clonage et I'AONc simple brin dans un volume de 100 nJ avec 
32.5 unites de I'enzyme ADN ligase du phage T4 (Pharmacia reference 270 87002) 
pendant une nuit a 15°C dans un tampon de composition : Tris HCI 50 mM pH 7,5. 
MgCl2 10 mM, ATP 1 mM. 

h) Synthese du deuxieme brin de I'AONc 

On elimine les proteines par extraction au phenol suivie d'une extraction au 
chloroforme, puis on ajoute 1/10eme de volume d'une solution d'acetate cfammo- 
nium 10 mM. puis 2.5 volumes d'ethanol. On centrifuge, le culot est dissous dans le 
tampon de composition Tris acetate 33 mM pH 7.9 acetate de potassium 62.5 mM. 
acetate de magnesium 1 mM et dithiothreitol (DTT) 1 mM. le deuxieme brin d'ADN 
complementaire est synthetise dans un volume de 30 fd avec 30 unites de rerizyme 
ADN polymerase du phage T4 (Pharmacia, reference 270718) et un melange de 1 
mM des quatre desoxynudeotides triphosphates de dATP. dCTP. dGTP et dTTP. 
ainsi que deux unites de la proteine du gene 32 du phage T4 (Pharmacia, reference 
27-0213)) pendant une heure a 37°C. On extrait au phenol et on retire les traces de 
phenol par une colorwe de polyacrylamide P10 (Biogel P10-200-400 mesh - 
reference 15011050 - Biorad). 
i) Transformation par electroporation 
On transforme des cellules E. Co// MC 1061 avec I'ADN recombinant obtenu 
precedemment par electroporation a I'aide de I'appare.l Biorad Gene Pulser (Biorad) 
utilise a 2,5 kV dans les conditions prescrites par le fabricant. puis on fait pousser 
les batteries pendant une heure dans du milieu dit milieu LB (Sambrook op cite) de 
composition : bactotryptone 10 g/l ; extrait de levure 5 g/l ; NaC1 10 g/l. 
On determine le nombre de clones independants en etalant une dilution au 
1/1000eme de la transformation apres la premiere heure (fincubation sur une boite 
de milieu LB addition™ de 1.5 % d'agar (p/v) et de 100 ng/ml d'ampicilline. appele 
par la suite milieu LB gelose. Le nombre de clones independants est de 1 million, 
j) Analyse des ADNc de la banque 
Dans le cadre de f'analyse de clones individualises de la banque par un 
sequencage nucleique du 5' des ADNc, un clone, denomme SR-p70a s'est revele 
presenter une homologie partielle avec TADNc de la proteine deja connue la 
proteine p53 (Genbank X 02469 et X 16384) (Figure 1). Les sequences ont ete 
reahsees avec le kit United States Biochemical (reference 70770) et/ou le kit Applied 
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Biosystems (references 401434 et/ou 401628) qui utilisent la methode de Sanger et 
aL Proc. Natl. Acad. Sci. USA ; 1977. 14, 5463-5467. L*ADN plasmidique est 
prepare a partir du kit WIZARD mini preparation (Promega reference A7510). Les 
amorces utilisees sont des oligonucleotides de 16 a 22 mer, complementaires soit 
au vecteur pSE1 dans la region immediatement en 5' de I'ADNc, soit a la sequence 
de I'ADNc. 

Un second ADNc a ete isole a partir de la meme banque en criblant de maniere 
similaire a la technique decrite dans I'EXEMPLE III 3) ci-apres avec un fragment de 
I'ADN SR-p70a marque au 32 P avec le kit 8RL "Random Primers DNA labelling 
systems" (reference 18187-013). Les tampons d'hybridation et de lavage sont 
additionnes de 50 % de formamide. Le dernier lavage est realise en 0,1 x SSC/SDS 
0,1 % a 60°C. Cette seconde sequence (ADNc SR-p70b) est identique a la premiere 
mais presents un fragment interne d6(6t£ (Figure 3). 

Les deux ADNc SR-p70, d'une longueur de 2874 nucleotides (SR-p70a) et de 2780 
nucleotides (SR-p70b) correspondent aux produits d'un seul gene, un epissage 
altematif entrainant une deletion de 94 bases entre les nucleotides 1637 et 1732 et 
una terminaison prematuree de la prot&ne codee correspondante. Les proteines 
deduttes des deux ADNc presentent respectivement 637 acides amines et 499 
acides amines (Figures 4 et 5). 

EXEMPLE II 

Obtention de la sequence et clonage de I'ADNc de la proteine SR-p70a a partir de 
cellules HT-29 (Adenocarcinoma de colon humain). 

V Culture des cellules HT-29 

Les cellules sont cuitivees en milieu McCoy 5 (GIBCO 26600-023) additionne de 10 % 
de serum foetal de veau (GIBCO 10081-23) et 50 mg/l de gentamycine jusqu'a semi- 
confluence. 

2) Pr&pamtion de I'ADN comptementaire 

L'ARN messager est prepare comme decrit dans I'EXEMPLE I.2. L'ADNc est prepare 
de maniere similaire d ceile decrite dans I'EXEMPLE I.3 avec 5 ng d'ARN messager 
total en utilisant une amorce poty(T) 12 . La reaction n'est pas interrompue avec de 
I'EDTA. 
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3) Amplification specifique de I'ADNc humainparla technique dite de PCR 
La polymerisation est realised avec 4 ul d'ADNc dans 50 final avec le tampon de 
composition suivante : Tris HCI 10 irM pH 8.3. MgCI 2 2.5 mM. KCI 50 mM en 
presence de 10 % DMSO. dNTP 0.5 mM. 4 ng/ml de chacune des deux amorces 
nucleiques et de 2.5 unites de Taq ADN polymerase (Boehringer). Les couples 
d'amorces ont ete choisis sur la sequence nucleique du clone SR-p70 de COS-3 
notamment en amont de I'ATG d'initiation et en aval du TGA d'arret de traduction et 
sont de compositions suivantes : 

amorce sens : ACTGGTACQ GCG AGC TGC CCT CGG AG 
site de restriction Kpn I 

amorce antisens : GAC TCTAGA GGT TCT GCA GGT GAC TCA G. 

site de restriction Xba I 

La reaction est realisee durant 30 cycles 94 8 C/1 minute, 54-60°C/1 minute 30 
secondes et 72 a C/1 minute 30 secondes. suivi d'un dernier cycle de 72°C/6 minutes. 

4) Obtention de la sequence de I'ADNc humain 

Dans un premier temps, le produit de PCR est elimine des oligonucleotides sur une 
colonne de sephacryi S400 puis dessaie par chroma togra ph. e ^exclusion sur une co- 
lonne de polyacrylamide P10 (Biorad reference 1504144). Les reactions de 
sequencage sont realisees a I'aide du kit Applied Biosystems (reference 401628) 
avec des oligonucleotides specifiques de I'ADNc. La sequence obtenue est tres 
similaire a cede du SR-p70a de singe et la proteins deduite contient 636 acides 
amines (Figure 6). 

De maniere similaire. d'autres sequences issues de lignees ou de tissus humains ont 
ete obtenues pour la partie codante du SR-p70 humain. notamment a partir du 
poumon ou du pancreas. Les proteines deduites de ces sequences sont identiques a 
cedes obtenues pour la lignee HT-29. 

5) Oonage de I'ADNc humain dans le plasmide P CDNA3 (Invitmgen V 790-20) 
Le produit PCR obtenu en 3) ainsi que le plasmide sont digeres par les deux enzymes 
de. restriction Kpn I et Xba I puis purifies apres migration sur un gel d'agarose 1 % a 
raide du kit Geneclean (Bio 101 reference 3105). Apres ligation avec 100 ng d'insert 
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et 10 ng de vecteur et transformation (technique decrite dans TEXEMPLE L3.g et i, les 
clones recombinants sont verifies par sequen^age a I'aide du kit Applied Biosystems 
cite ci-dessus. 

5 

EXEMPLE III 

Clonage de I'ADNc du SR-p70 de souris a partir de cellules AtT-20 (tumeur 
hypophysaire) 

0 

1) Culture celfulaire de la Irgn6e AtT-20 

Les cellules sont cultivdes dans du milieu Ham F10 (GIBCO 31550-023) additional de 
15 % de serum de cheval (GIBCO 26050*047) et de 2,5 % de serum foetal de veau 
(GIBCO 10081-073) et de 50 mg/l de gentamydne jusqu'a semi-confluence. 

5 

2) Preparation de fa banque d'ADN compldmentaire 

La banque est r£alisee comme decrit dans I'EXEMPLE I, 2) et 3) a partir des cellules 
cultivees ci-dessus. 

3 3) Crib/age de la banque 

a) Preparation des membranes 

Les clones de la banque sont etalds sur du milieu LB gelose (boTtes de petri diametre 
150) revdtu da membranes Biodyne A ( PALL reference BNNG 132). Apr6s une nuit a 
37°C. les clones sont transferes par contact sur de nouvelles membranes. Ces 

5 demidres sont traitdes en les d6posant sur du papier Whatman 3 mm imbibe des 
solutions suivantes : NaOH 0.5 N, NaCI 1.5 M pendant 5 minutes puis Tris HCI 0.5 M 
pH 8 . NaCI 1.5 M pendant 5 minutes. Aprds un traitement a la proteinase K dans le 
tampon suivant : Tris HCI 10 mM pM 8 , EDTA 10 mM, NaCI 50 mM, SDS 0.1 %, 
proteinase K 100 ug/ml pendant une heure d temperature ambiante, les membranes 

3 sont tav6es abondamment dans du 2 x SSC (sodium citrate NaCI), sechees, puis 
incubdes au four sous vide a 80°C pendant 20 minutes. 

b) Preparation de la sonde 

Sur la base de sequences des AONc SR-p70 de singe et d'humain, une premiere 
sequence a ete realiste sur un fragment amplifi* a partir de I'ARNm de la lignee AtT- 
5 20 comme decrit dans I'EXEMPLE II. 3 et 4 avec les oligomeres de compositions 
suivantes : 
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amorce sens GCC ATG CCT GTC TAC AAG 
amorce antisens : ACC AGC TGG TTG ACG GAG. 

Sur la base de cette sequence, una sonde oligomerique specifique de souris a ete 
choisie et presente la composition suivante : 
GAG CAT GTG ACC GAC ATT G. 

100 ng de la sonde sont marques en 3' avec 10 unites de Terminal Transferase 
(Pharmacia) et 100 uCi de dCTP a*2p 300 0 Ci/mmole (Amersham reference PB 
10205) dans 10 ul du tampon suivant : Tris HCI 30 mM pH 7.6 , ac.de cacodylique 
140 mM. CoCI 2 1 mM. DTT 0.1 mM pendant 15 minutes a 37*C. Les nucleotides 
radiomarques non incorpores sont elimines sur une colonne de polyacryfamide P10 
(Biorad. reference 1504144). La sonde obtenue a une activite specifique environ de 
5.10 8 dpm/ug. 

c) Prehybridation et hybridation 

Les membranes preparees en a) sont prehybridees 30 minutes a 42*C dans 6 x SSC. 
5 x Denhart's. 0.1 % SDS puis hybridees quelques heures dans le meme tampon 
additionne de fa sonde preparee en b) a raison de 10 6 dpm/m». 

d) Lavage et exposition des membranes 

Les membranes sont lavees deux fois a temperature ambiante dans le tampon 2 x 
SSC/SDS 0.1 % puis une heure a 56 e C en 6 x SSC/SDS 0.1 %. Les clones hybrides 
sont reveles avec des films KODAK XOMAT. Un clone positif contenant le SR-p70 de 
souris est setectionne et denomme ci-apres SR-p70c. 

4) Sequengage du SR-p70 de souris at analyse de fa sequence 
La sequence est obtenue a I'aide du kit Applied Biosystem (reference 401628). La 
sequence proteique deduite de I'ADNc SR-p70c de souris (Rgure 7) presente une 
tres forte homologie avec cedes de Thumain et de singe except© dans la parte N- 
termtnale qui diverge fortement (voir Figure 9). A I'aide de la technique dite de PCR 
de maniere s.m.laire a cede decrite dans I'EXEMPLE II.3 et 4. une seconde sequence 
5' (issue de la meme banque AtT-20) a ete obtenue (Figure 8). La sequence 
proteique N-terminale deduite (sequence denomme SR-p70a) est tres similaire a cede 
deduite des ADNc SR-p70 humain et de singe (SR-p70a) (Figure 9). La lignee AtT-20 
presente done au moins deux transcripts SR-p70. Ces 2 demiers divergent dans la 
partie N-terminale par des epissages differents. 
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EXEMPLE IV 

1) Production de proteine recombinants SR-p70 dans £. coli 

a) Construction du plasmide d'expression 

Elle consiste a mettre la parte -COOH terminate de ta proteine SR-p70a de singe, 
depuis la valine en position 427 a I'histidine -COOH terminals en position 637, en 
fusion avec la glutathione S-transferase (GST) du vecteur plasmidique pGEX-4T-3 
(Pharmacia reference 27-4583). Pour cela, I'insert correspondant de la SR-p70a 
(position 1434 a 2066) a ete amplifie par PCR avec 10 ng de plasmide contenant 
I'ADNc SR-p70a de singe. Les amorces nucieiques sont de composition suivante : 

amorce sens : TTT GGA TCC GTC AAC CAG CTG GTG GGC CAG 
site de restriction BamHI 

amorce antisens : AAA GTC GAC GTG GAT CTC GGC CTC C. 
site Sal I 

Le fragment obtenu ainsi que le vecteur sont digeres par les enzymes de restriction 
BamHI et Sal I et le clonage est realise comme decrit dans r EXEMPLE II. 5. Le clone 
selectionne est appele pG SR-p70. 

b) Expression et purification de la proteine fusion GST-pSR-p70 

Cette dtape a ete realisee en utilisant le kit "bulk GST purification module" (Pharmacia 
Reference 27-4570-01). 

De maniere schdmatique, le done recombinant a ete mis en culture a 37*C dans un 
litre de milieu 2x VTA + ampicilline 100 ng/ml. A DO 0,8, I'expression est induite avec 
0,5 mM d'IPTG pendant 2 heures a 37°C. Aprfcs centrifugation, le culot cellulaire est 
reprls dans du PBS froid puis sonique par ultrason. Aprfcs adjonction de 1 % triton X- 
100, on incube 30 minutes sous agitation d temperature ambiante. Apres 
centrifugation a 12 000 g. 10 minutes d 4°C, on recupfcre le sumageant. La purifica- 
tion est ensuite r£alis6e sur una colonne de chromatographie d*affinit6 glutathion 
sepharose 4B. La fixation et le lavage sont realises en tampon PBS et relation est 
realisee par competition avec du glutathion reduit. La concentration finale est amenee 
a 300 }ig/ml de proteine fusion. 
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2) Production de proteine SR-p70a dans las cellules COS- J. 

Les cellules COS-3 sont transferees avec de I'ADN plasmidique pSE1 dans lequel a 
ete done I'ADNc de SR-p70a de singe (EXEMPLE 1.1) ou avec de I'ADN plasmidique 
du vecteur pSE1 en tant que temoin par la technique du DEAE Dextran : les cellules 
COS-3 sont ensemencees a 5 x 10 5 cellules par boite de 6 cm en milieu de culture 
contenant 5 % de serum de bovin foetal (EXEMPLE 1.1). Apres culture, les cellules 
sont rincees avec du PBS. On ajoute 1 ml du melange suivant : milieu contenant 6.5 
pg d'ADN, 250 pg/ml de DEAE Dextran et 100 pM de chloroquine. Les cellules sont 
incubees a 37°C en 5 % CO2 durant 4 £ 5 heures. Le milieu est aspire, on ajoute 2 ml 
de PBS additionne de 10 % DMSO et les cellules sont incubees pendant une minute 
en remuant legerement les boites. Le milieu est a nouveau aspire et les cellules sont 
rincees deux fois avec du PBS. Les cellules sont alors incubees a 37°C avec du 
milieu contenant 2 % de serum de bovin foetal pendant la duree de lexpression qui 
est generalement de 3 jours. 

La proteine SR-p70a est alors analysee comme decrit dans TEXEMPLE VI par 
immunoempreinte. 



EXEMPLE V 

Preparation d'anticorps specifiques 

150 no de proteines de r6chantillon prepare selon TEXEMPLE IV ont ete utilises pour 
immuniser un lapin (male de 1,5 * 2 kg environ. New-Zealand). Les immunisations ont 
ete effectuees tous les 15 jours seton le protocole decrit par Vaitukaitis, Methods in 
Enzymology, 1981. 73. 46. Pour la prendre injection, un volume de solution antige- 
nique est 6mulsifi6 par un volume d'adjuvant complet de Freund (Sigma reference 
4258). Cinq rappels ont ete administres en adjuvant incomplet de Freund (Sigma 
reference 5506). 

EXEMPLE VI 

Detection de la proteine SR-p70 "Western immunoblotting" (immunoempreinte) 

1) Materials utilises pour Hmmunoempreinte 

a) Lignees cellulaires utilises pour nmmunoempreinte. 

Les lignees cellulaires suivantes ont et* cultivSes, comme d6crit dans le catalogue 
^catalogue of cell lines and hybridomas, 7^ edition, 1992» de TATCC (American Type 
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Culture Collection) : COS-3, CV-1 (lignee de cellules de rein de singe), HT-29, U- 
373MG (glioblastome humain), MCF7 (adenocarcinoma mammaire humain), SKNAS 
(neuroblastome humain cultive dans les memes conditions que COS-3). SK-N-MC 
(neuroblastome humain). IMR-32 (neuroblastome humain). CHP212 (neuroblastome 
humain cultive dans les memes conditions que CV-1), Saos-2 (osteosarcome), SK- 
OV-3 (adenocarcinome d'ovaire) et SW 480 (adenocarcinoma de colon humain). 
b) Cellules COS-3 transferees par I'AONc SR-p70a. 

Les cellules COS-3 ont ete transfectees comme decrit dans I'EXEMPLE IV.2. En tant 
que temoin, les cellules ont etd transfectees avec de I'ADN plasmidique pSE1 ne 
contenant pas I'ADNc recombinant SR-p70a. 

2) Preparation des 6chantilions prot&ques d partir de culture ceilulaire eucaryote ou 
de cellules transfectees. 

Apres culture, les cellules sont lavees avec du PBS puis reprises dans un tampon 
RIPA (PBS avec 1 % NP40, 0,5 % sodium deoxycholate, 0.5 % SDS) complement^ 
avec 10 ^g/ml RNAse A, 20^g/ml DNAse 1, 2 fig/ml aprotinine, 0 ( 5 ng/ml leupeptine. 
0.7 ng/ml pepstatine et 170 ^g/ml PMSF. Les cellules sont soniquees par ultrason a 4 
°C et latssees 30 minutes £ 4°C. Apr&s microcentrifugation a 12 000 rpm ( on recupere 
le sumageant. La concentration de proteine est mesuree par la methode de Bradford. 

3) "Western blotting" 

5 ou 50 tig de proteines (50 pg pour les lignees celluiaires et 5 pg pour des cellules 
transfectees) sont mis dans 0,2 volume du tampon d'electrophorese 6X suivant : Tris 
HCI 0.35 mM pH 6,8 10,3 % SDS, 36 % glycerol, 0.6 mM DTT, 0.012 % bleu de 
bromophenol. Les echanttllons sont deposes et mis a migrer dans un gel SDS-Page 
10 % (30/0,8 Bis) puis electrotransterds sur une membrane de nitrocellulose. 

4) R6v6lation par Vanttcorps 

La membrane est incubee 30 minutes dans le tampon de blocage TBST (Tris HCI 10 
mM pH 8, NaCI 150 mM, 0,2 % Tween 20) additionnd de 5 % de lait (GIBCO- SKIM 
MILK) a temperature ambiante. La membrane est successivement mise en presence 
de l anticorps anti-SR-p70 (aSR-p70) dans le m6me tampon 16 heures £ 4°C, lavee 3 
fois pendant 10 minutes avec du TBST, puis incubee une heure d 37°C avec un 
second anticorps anti-immunoglobuline de lapin coup!6 avec de la peroxydase 
(SIGMA A055). Apr6s trois lavages de 15 minutes, la revelation est effectuee en utili- 
sant le kit ECL (Amersham RPN2106) par chimioluminescence. 
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Parallelement, les memes echantillons ont ete reveles par un anticorps anti-p53 (a 
p53) (sigma BP5312) suivi d*un second anticorps anti-immunoglobine de souris. 

5) Figures et r&suttats. 

Figure 10 : Immunoempreinte de la proteine SR-p70 

Figure 10a : Detection de la proteine recombinante SR-p70 

- colonnes 1 et 3 : COS-3 transferee par le vecteur pSE1. 

- colonnes 2 et 4 : COS-3 transfectee par le plasmide pSE1 contenant CADNc du 
SR-p70a. 

- colonnes 1 et 2 : Revelation par I'anticorps anti-SR-p70 (aSR-p70). 

- colonnes 3 et 4 : Revelation par I'anticorps anti-P53 (ap53). 
Figure 10b : Detection de la proteine endogene SR-p70 

- colonnes 1 : COS-3 ; 2 : CV-1 ; 3 : HT-29 ; 4 : U-373 MG ; 5 : MCF7 ; 6 ; SKNAS ; 7 
: SK-N-MC ; 8 : IMR-32 ; 9 : CHP212 ; 10 : Saos-2 ; 11 : SK-OV-3 et 12 : SW480. 

A : Revelation par I'anticorps aSR-p70. 
B : Revelation par Tanticorps ap53. 

L'anticorps aSR-p70 reconnait specifrquement les prolines recombinantes (Figure 
10a) et endogenes (Figure 10b) et ne croise pas avec la p53. L'analyse de lignees 
cellulaires humaines ou de singe montre que la proteine SR-p70 comma la p53 est 
generalement faiblement detectable. Par centre, lorsqu'une accumulation de p53 
existe, la SR-p70 devient elle aussi plus facilement detectable (Figure 10b). Une 
etude par RT-PCR de la distribution des transcrits SR-p70 montre que le gene est 
exprime dans tous les types cellulaires testis. 



EXEMPLE VII 

Clonage du gene du SR-p70 et localisation chromosomique. 
1) Clonage du g£ne SR-p70 

La banque utilisee est une banque de cosmides, prtparee avec de I'ADN genomique 
humain purifte de placenta, et commercialisee par Stratagfcne (reference 95 1202). 
Le criblage du gdne est realist comme decrit dans I'exemple III.3 avec un fragment 
d'ADN SR-p70 marqu6 au 32 p avec , e kit BRL » Random Primers 0NA Labelljng 
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Systems- (reference 18187-013). Les tampons d' hybridation et de lavage sont 
additionnes de 50 % formamide. Le dernier lavage est realise en 0,1 x SSC/SOS 
0,1 % a 60°C. De maniere similaire t le gene SR-p70 a ete isole a partir d'une banque 
preparee avec de I'ADN genomique de la souris black C57. 

line analyse et un sequen$age partiel des clones mettent en evidence la presence de 
14 exons avec une structure proche de cede du gene p53 ( notamment dans la partie 
centrale ou la taille et le positionnement des exons sont tres conserves (Figure 12). 
Cette structure a ete definie partiellement chez la souris et chez I'homme. 
A titre d'exempie, les sequences genomiques humaines du 3' de lintron 1 , de I'exon 
2. de l intron 2, et du 5* de I'exon 3 sont presentees dans la figure 13. 

2) Localisation chromosomique du g&ne SR-p70 chez I'homme 

Efle a ete reaiisee avec de I'ADN du gene SR-70 humain en utilisant la technique 
decrite par R. Slim et al., Hum. Genet.. 1991, 88, 21-26. Cinquante mitoses ont ete 
analysees dont plus de 80% avaient des doubles spots localises en 1p36 sur les deux 
chromosomes et plus particulterement en 1p36.2 -1p36.3 (Figure 11). (.'identification 
du chromosome 1 et son orientation sont basees sur I'h^terochromatine de la 
constriction secondare. Les images ont §t6 faites sur un microscope Zeiss Axiophot. 
saisies par une camera CCD refroidie LHESA et traitees par Optilab. 



EXEMPLE VIII 

A) Mise en evidence d'un ARNm codant pour une proteine SR-p70 humaine deduite 
presentant d la fois une extremity N-terminale plus courte et une divergence. 

1) Cultures des cellules IMR-32 (neurotlastome humain) 

Les cellules ont 6t6 cuKiv^es comma d6crit dans le catalogue "catalogue of cell lines 
and hybridomas, 7th edition. 1992 M de I'ATCC (American Type Culture Collection). 

2) Preparation de I'ADNc 

L'ARN est prepare comma decrit dans rexemple L2.a. L'ADNc est prepare de maniere 
similaire * celle dicrite dans rexemple 1.3 avec 5 ug d'ARN total dans un volume final 
de 20 Ml en utilisant une amorce poly (T) 12 et avec des nucleotides froids. La reaction 
n est pas interrompue avec de I'EDTA. 



WO 97/28186 



PCT/FR97/00214 



29 



3) Amplification specifique de f'ADNc SR-P70 par fa technique dite de PCR 

La polymerisation est r6alisee avec 2 pi d'ADNc dans 50 pi final avec le tampon de 

composition suivant : Tris HCI 50 mM pH 9 t 2, 16 mM (NH 4 ) 2 S0 4 . 1,75 mM MgCI 2 . 

en presence de DMSO 10%, de NTP 0.4 mM. de 100 ng de chacune des deux 

amorces nucleiques et de 3,5 unites du melange des Taq et PWO polymerases 

(Boehringer Mannheim, ref. 1681 842). 

Le couple d'amorce est de composition suivante : 

amorce sens : AGGCCGGCGTGGGGAAG (position 16 a 32, Figure 6) 
amorce antisens : CTTGGCGATCTGGCAGTAG (position 503 a 485. Figure 6). 

La reaction est realises durant 30 cycles a 95°C/30 secondes. 58°C/1 minute et 
68°C/2 minutes 30 secondes suivi d'un dernier cycle de 68°C/10 minutes. 

Le produit PCR est soumis a una electrophone sur un gel d'agarose 1% (tampon 
TAE). Apres coloration au bromure d'ethidium. deux bandes majeures sont revelees : 
une bande d'une taille d'environ 490 pb (taille attendue (voir Figure 6)) et une bande 
supplemental d'une taille d'environ 700 pb. Cette demiere est extraite du gel a raide 
du kit "geneclean* (Bio 101, r6f 1001 400). Apres un dessalage sur une colonne de 
polyacrylamide P10 (Biorad. ref 15011050), le fragment est soumis a une nouvelle 
amplification par PCR durant 10 cycles comma decrit ci-dessus. 

4) Determination de la sequence du produit ampJiM 

Dans un premier temps, le produit PCR est 6limine des oligonucleotides sur une 
colonne de sephacryl S400 (Pharmacia 17-0609-01) puis dessale sur une colonne de 
P10. La reaction de $6quen$age est realise a raide du kit Applied Biosystems (ref. 
401 628) (373 DNA sequencer) avec famorce antisens. 

La sequence obtenue est identique d la sequence de I'ADNc SR-p70 (exemple IU) 
avec une insertion de 198 pb entre les positions 217 et 218 (Figure 14). La sequence 
proteique N-termrnale deduite (sequence d*nomm6e SR-p70d) est plus courte de 49 
acides amines avec une divergence des 13 premiers acides amines (sequence ID 
N°13). II y a done co-existence d'au moins deux transcrits differents SR-p70 comme 
d6j£ ddcrit pour la Iign6e AtT-20 de souris. 



une 
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B) Clonage du SR-p70 humain et mise en evidence d un ARNm codant pour 
proteine SR-p70 humaine d6duite presentant fa meme extremite N-terminale que le 
SR-p70d et une divergence dans ta partie C-terminale 

1) Amplification specifique de I'ADNc du SR-p70 par la technique dite de PCR 

Uamplification a ete realtsee comme decrit dans I'EXEMPLE VIM.A a partir d'ARN 
purifie des cellules IMR-32 avec le couple d'amorces de composition suivante: 

amorce sens : GCG GCC ACG ACC GTG AC (position 160 a 176. sequence 

IDN° 11) 

amorce antisens : GGC AGC TTG GGT CTC TGG (position 1993 a 1976, 
Figure 6). 

Apres elimination de I'exces d'amorces sur colonne S400 et dessalage sur colonne 
P10, 1pl de I'echantillon est de nouveau soumis a une PCR avec le couple d'amorces 
de composition suivante : 

amorce sens : TAT CTC GAG CTG TAC GTC GGT GAC CCC 

Xno 1 (position 263 a 280, sequence 10 

N° 11) 

amorce antisens : ATA TCT AGA TCA GTG GAT CTC GGC CTC 

I (position 1943 a 1926. Figure 6). 

2) Clonage du produit amplifid dans le plasmide pCDNA3 

Le produit PCR obtenu en 1) est dessatt sur colonne P10, digere par les enzymes de 
restriction Xho I et Xba l t puis clone dans le plasmide pCDNA3 comme d6crit dans 
I'EXEMPLE II.5 Deux clones recombinants sont sequences a I'aide du kit Applied 
Biosystems avec les oligonucleotides spectfiques de I'ADNc du SR-p70. 
La premiere sequence obtenue correspond a la sequence complete de I'ARNm 
codant pour le SR-p70 d*crit dans I'EXEMPLE Vlll.a .La proline deduite comporte 
587 acides amines (sequence ID N° 13 et Figure 16). 

La seconde sequence obtenue est identique d la sequence de r ADNc de SR-p70d 
d6crite ci-dessus mats avec deux delations de 149 pb et de 94 pb entre les positions 
1049 et 1050 d'une part et entre les positions 1188 et 1189 d'autns part (sequence 10 
N* 14 et Figure 15). La sequence proteique deduite de cette seconde sequence 
revdle une proline ayant une partie N-terminale plus courte de 49 acides amines 
avec une divergence dans les 13 premiers acides amines ainsi qu une divergence de 
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sequence proteique entre les acides amines 350 et 397 (sequence ID N° 15 et Figure 
16) (sequence denommee SR-p70e). La proteine deduite comporte 506 acides 
amines. 

C) Mise en evidence d'un ARNm codant pour une proteine SR-p70 humaine deduite 
presentant une extremite N-terminale plus courte 

1) Culture des cellules SK-N-SH (neuroblastome humain) 

Les cellules sont cultivees comma d6crit dans le « catalogue of cell lines and 
hybridomas. 7th edition. 1992 » de I'ATCC (American Type Culture Collection). 

2) Preparation de I'ADNc et amplification de J'ADNc du SR-p70 par la technique dite 
de PCR 

Ces etapes sont realisees comme decrit dans I'EXEMPLE VIII.A avec le couple 
d'amorces de composition suivante: 

amorce sens : AGG GGA CGC AGC GAA ACC (position 128 a 145. Figure 

17) 

amorce anti sens :GGC AGC TTG GGT CTC TGG (position 1993 a 1976 Figure 

6). 

Le sequence est realise avec le kit Applied Biosystem avec des amorces 
spectfiques de I'ADNc du SR-p70 et revele deux ADNc : 

- un premier AONc correspondant a I'ARNm codant pour le SR-p70a 

- un second ADNc presentant une d6l6tion de 98 pb entre les positions 24 et 25 
(sequence ID N° 16 et Figure 15). 

Cette d6!6tion comprend I'ATG d'initiation de traduction du SR-p70a. La proteine 
dSduite (ddnomm^e SR-p70f) de ce second ADNc presente un ATG initiateur de 
traduction en aval correspondant 4 un ATG interne du SR-p70a. La proteine deduite 
comporte done 588 acides amines (sequence ID N° 17 et Figure 16) et est tronquee 
des 48 acides amines N-terminaux du SR-p70a. 

D) Mise en Evidence d'un ARNm codant pour le SR-p70b humain. 
1) Culture des cellules K562 
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Les cellules sont cultivees comme decrit dans le "catalogue of cell lines and 
hybridomas. 7 th edition, 1992" de I'ATCC (American Type Cylture Collection). 

2) Preparation de I'ADNc, amplification de I'ADNc du SR-p70 par la technique dite de 
PCR et sequen^age. 

Ces etapes sont realisees comme decrit dans I'EXEMPLE VIII. C. 
Le sequenfage revele deux AONc : 

Un premier ADNc correspondant a I'ARNm codant pour le SR-p70a et un second 
ADNc presentant une deletion de 94 pb entre les positions 1516 et 1517 (sequence 
ID N° 18 et Figure 15). La proteine deduite (denommee SR-p70b) comporte 199 
acides amines et presente une sequence C-terminale tronquee de 137 acides amines 
par rapport au SR-p70a avec les 4 demiers acides amines divergents (sequence ID 
N° 19et Figure 21). 

Get ADNc est similaire d celui d§crit dans I'EXEMPLE I relatif au SR-p70b de singe. 

Les molecules decrites dans cet exemple (EXEMPLE VIII. A. B. C. et D) mettent en 
evidence des variants du SR-p70 cons^cutifs £ des epissages difterentiels de I'ARNm 
primaire transcrits par le gene SR-p70. 

Le SR-p70a est code par un ARNm compost de 14 exons (voir EXEMPLE VII). C'est 
la proline de reference. Le SR-p70b est consecutif a une insertion entre les exons 3 
et 4 et d ( absence des exons 11 et 13. Le SR-p70f est consecutif & rabsence de 
lexon 2. Cet exemple decrit I'existence de variants du SR-p70 de maniere non 
exhaustive, avec une probabiiite forte d'existence d'autres variants. De m£me, 
I'existence de ces variants decrits dans cet exemple ainsi que le SR-p70a ne se limite 
pas aux lignees dans lesquelles ils ont et6 mis en evidence. En effet des etudes 
effectuges par RT-PCR ont montre que ces variants sont retrouves dans les diverses 
lignees 6tudi6es. 

De plus, la methionine d'initiation du SR-p70f correspond a une methionine interne du 
SR-p70a, suggerant la possibility d'initiation en aval sur I'ARNm codant pour le SR- 
p70a. 
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EXEMPLE IX 



Obtention d'une sequence 5* de I'ARNm SR-P70a humaine. 



1) Amplification de I'extremitd de S'de I'ADNc SR-P70 par PCR 
La culture cellulaire et les preparations d'ARN total et d'ADNc sont realisees comme 
decrit dans I'EXEMPLE VIII. 1 et 2. La matrice ARN est hydrolysee par incubation 5 
minutes a 65°C apres adjonctlon de 4 pi EDTA 500 mM et 4 pi NaOH 2N. 
Lechantillon est ensuite dessaJe surcolonne P10. L'ADNc est allonge en 3' avec une 
"queue" de dG comme decrit dans I'EXEMPLE l.3.d, dans un volume final de 40 pi. 
Apres adjonction de 4 pi EDTA 500 mM et 4 pi NaOH 2N. I'ADNc est incube a 65'C 
pendant 3 minutes puis dessale sur une colonne P10. L'amplification par PCR est 
realisee comme decrit dans r EXEMPLE VIII.3 avec 8 pi d'ADNc et durant 30 cycles 
avec le couple d'amorces de composition sutvante : 

amorce sens : CCCCCCCCCCCCCCN<ouNest egal a G.A ou T) 
amorce antisens : CCATCAGCTCCAGGCTCTC (position 1167 a 1149 Figure 
8). 

Apres elimination de I'exces d'amorces sur colonne S400 et dessalage sur colonne 
P10. 1 pi de rechantillon est de nouveau soumis a un PCR avec le couple de 
composition suivante : 

amorce sens : CCCCCCCCCCCCCCN 

amorce antisens : CCAGGACAGGCGCAGATG (position 928 a 91 1 , Figure 6). 

L'echantillon. de nouveau passe sur une colonne S4Q0 et une colonne P10, est 
soumis a une troisieme amplification durant 20 cydes avec le couple suivant : 
amorce sens : CCCCCCCCCCCCCCCN 

amorce antisens : CTTGGCGATCTGGCAGTAG (position 503 a 485. Figure 6). 
2) Determination de la sequence 5'ADNc SR-P70 

La sequence est realisee comme decrit dans I'EXEMPLE VIII.4). Cette sequence fait 
apparaTtre un 5' non codant d'au moins 237 bases en amont de I'ATG d'initiation du 
SR-p70a (Figure 17). Par comparaison de cette sequence (obtenue a partir de la 
lignee IMR-32) avec cede obtenue a partir de la lignee HT-29 notamment (Figure 6). 
deux differences ponctuelles (Figure 17 : voir caracteres gras) sont mises en 
evidence (G ■> A et C 4 T) respectivement positionne a -20 et -30 de I'ATG 
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d'initiation du SR-p70a (Figures 6 et 17). Cette variabilite est situee au niveau de 
I'exon 2 (Figure 13). II n'est pas exclu que cette variabilite se retrouve egalement a 
rinterieur d'une phase codante consecutivement a un epissage altematif comme 
decrit dans les EXEMPLES III chez la souris et VIII chez I'homme ou bien 
consecutivement a une initiation de la traduction sur un CTG (comme cela a ete 
demontre pourle FGFb (Proc. Natl. Acad. Sci USA, 1989. 86. 1836 - 1840). 
De meme, il n'est pas exclu que cette variabilite ait une implication sur la traduction du 
SR-p70 ou sur J'epissage de TARN primaire. 

En tout etat de cause, cette variabilite, probablement d'origine allelique. peut servir de 
marqueur soit au niveau genomique (voir EXEMPLE XI). soit au niveau de I'ARNm 
(voir EXEMPLE X). 



EXEMPLE X 

1) AnatysQ par PCR, de Vexpression transcnptionnelle du SR-P70a dam tes 
echantillons ceilulaires (RT - PCR) 

Les cultures ceilulaires (SK-N-AS. SK-N-MC, HT-29. U-373MG, SW480, IMR-32, 
CHP212) sont realisees comme decrit dans I'exemple VI. 1. a (referees au catalogue 
"catalogue of cell lines and hybridomas, 7th edition" 1992 de I'ATCC). 
La preparation de I'ADNc et I'amplification par PCR sont realisees comme decrit dans 
I'exemple VIII.2 et 3. Le couple d 'amorce utilise est de composition suivante : 
amorce sens : AGGGGACGCAGCGAAACC (position 128 £ 145, Figure 17) 
amorce antisens : GGCAGCTTGGGTCTCTGG (position 1993 a 1976, Figure 
6). 

Les echantillons sont analyses par electrophorese sur un gel d' agarose 1% et 
revelation au Bromure d'6thidium (Figure 18). 

La taille de la bands obtenue dans les echantillons correspond a la tattle attendue 
(environ 2 kb, Rgures 6 et 17). L'intensite des bandes obtenues est reproductible. 
Une reamplification de 1 pi de I'Schantillon dans les m§mes conditions durant 20 
cycles fait apparaitre une bands dans chacun des echantillons. 

2) Determination de /a sequence des pmduits ampliMs 

Apres passage des echantillons sur colonnes S400 et P10, le sequence est realise 
sur le sequenceur 373 de Applied Biosystems avec le kit de reference 401 628. Les 
amorces utilisees sont entre autres tes suivantes : 
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position fig ure 

AGGGGACGCAGCGAAACC 128 a 145 22 

CTTGGCGATCTGGCAGTAG 503 a 485 6 

GATGAGGTGGCTGGCTGGA 677 a 659 6 

CCATCAGCTCCAGGCTCTC 1 167 a 1 149 6 

TGGTCAGGTTCTGCAGGTG 1605 a 1587 6 

GGCAGCTTGGGTCTCTGG 1 993 a 1 976 6 

Aucune difference proteique du SR-p70a n f a ete decelee Cependant les sequences 

obtenues font apparaitre une double variabilite aux positions -20 et -30 en amont de 

I'ATG d'initiation du SR-p70a (Figures 6 et 17). Cette variabilite. probablement 

d'origine allelique, permet de definir deux classes de transcrits : une premiere classe 

presentant unGala position -30 et un C a la position -20 (classe G* 3 0/c*20) et une 

seconde classe presentant une difference aux deux positions : un A en -30 et un T en 
-20 (classe A-30/7-20) 

Premiere classe : SK-N-AS. SK-N-MC, HT-29, U-373MG, SW480. 
Deuxieme classe : IMR-32, CHP212. 



EXEMPLE Xf 

M§thode d'analyse pour la determination de la repartition allelique du gene SR-p70 
dans un echantillonnage de 10 personnes. 

Cette repartition antique est basee surla variabilit6 antique mise en evidence dans 
les exemples IX et X : 

• AlldJe G-^O/C-20 pf 6sentant respectivement un G et un C aux positions -30 et -20 
en amont de I'ATG ^initiation du SR-p70a. 

• Allele A-30/T20 prtsentant respectivement un A et un T aux memes positions. 
Cette variability peut Stre mise en evidence par ('utilisation d'enzymes de restriction 
differenciant les deux alleles (Figure 13). A titre d'exemple : 

• Enzyme Bpl I presentant un site de coupure uniquement sur ('allele G" 30 /C-20 
dans la zone d'int6r§t (ce site englobe les deux positions variables). 

• Enzyme Styl presentant un site de coupure uniquement sur I'allele A-30/T-20 dans 
la zone tfintdrdt 
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1) Amplification gGnomique de i'exon 2 parPCR 

La reaction de polymerisation est realisee. avec 500 ng d'ADN genomique purifie, 
dans 50 pi final avec les conditions decrites dans I'exemple VIII. 3. 
Le couple d'amorces est de composition suivante : 

amorce sens : CACCTACTCCAGGGATGC (position 1 a 18. Figure 13) 

amorce antisens : AGGAAAATAGAAGCGTCAGTC (position 833 a 813, Figure 13) 

La reaction est realisee durant 30 cycles comme decrit dans I'EXEMPLE VIII. 3. 
Aprte elimination de I'exces d'amorce sur une colonne S400 et dessalage sur une 
colonne de P10, 1 pi de lechantillon est amplifie de nouveau durant 25 cycles dans 
les mdmes conditions avec le couple d'amorces suivant : 



amorce sens ; CAGGCCCACTTGCCTGCC (position 25 a 32. Figure.13) 

amorce antisens : CTGTCCCCAAGCTGATGAG (position 506 a 488. Figure 13). 

Les produits amplifies sont soumis a une electrophorese sur un gel d'agarose 1% 
(Figure 19-A). 

2) Digestion parl'enzyme de restriction Styt 

Les echantillons sont au prealable dessaies sur une colonne P10 puis digeres par 
lenzyme de restriction Styl (BRL 15442-015) dans le tampon de composition suivant : 
Tris HCI pH 8, 50 mM. NaCI 100 mM. MgCI 2 10 mM, a 37°C pendant 30 mn. Les 
produits de digestion sont analyses par electrophorese sur un gel d agarose 1% 
(tampon TAE). La rdvelation est realisee par coloration au bromure d'ethidium 
(Figure 19-B). 



Une bande de 482 paires de bases caracterise I'altele G- 30 /C" 20 (Figures 13 et 19). 
La presence d'une bande de 376 paires de bases et d'une bande de 106 paires de 
bases caracterisent I'alltle A-^O^O (a ,| d | e P re Se ntant un site de coupure Styl). 
Sur i'echantillonnage de 10 personnes, 2 personnes presentent les alleles G- 30 /C- 20 
et A'30/7-20 | es a autrBS personnes etant homozygotes avec I'altele G* 30 /C- 20 . 
Uetude d'un nouvel echantillonnage de 9 personnes a mis en evidence 3 personnes 
heterozygotes presentant les alleles G-30 /c -20 et A .30/ T -20 i | es 6 autres personnes 
etant homozygotes pour Tailzie G" 30 /^ 20 
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EXEMPLE XII 

Test de reversion de transformation de la lignee SK-N-AS par transfection avec 
I'ADNc SR-p70. 

Le vecteur d'expression utilise est decrit dans r EXEMPLE II.5 et schematise dans ta 
figure 15. La methode utilisee est cede dite du phosphate de calcium decrite par 
Graham et al. (Virology 1973, 54, 2, 536-539). La lignee est ensemencSe a raison de 
5.10 s cellules par boite de 6 cm de diam6tre dans 5 ml du milieu decrit dans 
Texemple 1.1. . Les cellules sont mises en culture d 37°C et d 5% de CO2 pendant une 
nuit. Le milieu de transfection est prepare de la maniere suivante : te melange suivant 
est realise en ajoutant dans I'ordre 1 ml de tampon HEBS (NaCI 8 mg/ml, KCI 370 
pg/ml. Na 2 HP0 4 -2H 2 0 125 Mg/ml, Dextrose 1 mg/ml, Hepes pH 7,05 5 mg/ml), 10 pg 
du plasmide * transfecter et 50 pi CaCI 2 2.5 M ajoute goutte a goutte. Le milieu de 
transfection est laissd 30 mn a temperature ambiante puis ajoute goutte a goutte sur 
le milieu contenu dans la boite de culture. Les cellules sont incubees 5 a 6 heures a 
37° C/5% C0 2 . Aprts aspiration du milieu, 5 ml de milieu frais contenant 2% de 
serum du bovin foetal sont ajoutes. Apres 48 heures £ 37" C/5% C0 2 , les cellules 
sont rinc^es avec du PBS, decoltees par trypsinisation, diluees dans 10 ml de milieu 
de culture (5% serum de bovin foetal) et 6talees dans une boite de 10 cm de diametre 
(la dilution peut dtre ajustee en fonction de I'efficacite de transfection). Apres une 
nouvelle incubation durant 10 heures (le temps que les cellules adherent), les cellules 
sont passees en selection par adjonction de G418 a la concentration finale de 600 
Mg/ml Equivalent g6n*tidne durant 15 & 21 jours (le milieu est change tous les jours). 
Les clones obtenus sont alors rinces au PBS, fixis a lethanol 70%, seches, colores 
avec 1 % de cristal violet puis comptabilises. 
Quatre transfections piasmidiques ont ete r£alis£es en double : 

- plasmide pCDNA3 sans insert 

- plasmide pCDNA3/SR-p70 contenant I'ADNc - SR-P70a humaine 

- plasmide pCDNA3/SR-p70 Mut contenant I'ADNc - SR-p70a presentant une 
mutation £ la position 293 AA (R -> H) qui est analogue a la mutation 273 (R 
H) dans le domaine de fixation d I'ADN de la p53 

* temoin sans plasmide. 



Le resultat est exprime en nombre de clones par boite. 
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Experience 1 


Experience 2 


Moyenne 


PCDNA3 


172 


353 


262 


pCDNA3 / SR-p70 


13 


8 


10 


pCDNA3 / SR-p70 mut 


92 


87 


89 


Absence de plasmide 


1 


3 


2 



Le nombre de clones obtenu par transfection avec le plasmide pCDNA3/SR-p70 est 
de 25 fois inferieur au nombre de clones obtenu avec le temoin pCONA3 et de 9 fois 
inferieur au nombre de clones obtenu avec te pcDNA3/SR-p70 Mut, indiquant une 
mortality ou un arrfct de division celluiaire des cellules transferees par I'ADNc SR- 
p70. Ce resultat n'est pas la consequence d'une toxicite au vue des clones obtenus 
avec TADNc SR-p70 mute mais probablement d'une apoptose comme cela a ete 
demontr6 pour la proteine p53 (Koshland et a/.. Sciences, 1993. 262, 1953-1981). 

EXEMPLE XIII 

Rdie biologique de fa proteine SR-p70. 

Lhomologie de structure entre le domaine de fixation a I'ADN de la p53 et ta region 
centrale de la proteine SR-p70 permet d'interer que ta SR-p70 est un facteur de 
transcription (cf. Figures 1 et 2). En effet la p53 (393 addes amines) est constitute 
de plusieurs domaines foncbonnels. La region N-tenminale (1-91 addes amines) est 
impliquee dans Tactivation de la transcription, et contient des sites ^interaction a 
differentes proteines cellulaires et virales. La partie centrale (acides amines 92 a 292) 
permet la fixation aux sequences d'ADN specifiques situes dans ies regions 
promotrices de certains genes (la majority des mutations ponctueiles inactivant la p53 
sont tocalisees dans cette region), elle presents egatement de nombreux sites 
d'interaction avec des proteines virales qui inhibent son activite. Enfin, ies 100 
demiers acides aminds de la p53 sont responsables de son oligomerisation ainsi que 
de la regulation de celle-ci (Hainaut P.. Current Opinion in Oncology, 1995, 7, 76-82 ; 
Prokocimer M., Blood, 1994, 84 n'8, 2391-2411). 

Lhomologie de sequence entre p53 et SR-p70 est significative notamment en ce qui 
conceme Ies addes amines impliques directement dans ('interaction a I'ADN 
suggerant que la SR-p70 se fixe aux sites p53 sur I'ADN. Ces acides amines 
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correspondent tres exactement a ce qu'on appelle les "hot spot*, acides amines 
frequemment mutes dans les tumeurs humaines (SWISS PROT : SW : P53_human et 
Prokocimer M., Blood, 1994, 84 n°8, 2391-2411). De cette homologie, on peut deduire 
que la proteine SR-p70 exerce un controle sur I'activite des genes regules par la p53, 
soit independamment de celle-ci soit en formant des heterooligomeres avec cette 
derniere. 

En consequence, d I'instar de la p53, les produits du gene SR-p70 doivent etre 
impliques dans le contrdle et la regulation du cycle cellulaire provoquant des arrets 
du cycle (momentanes ou definitifs), et la mise en oeuvre de programmes tels que : la 
reparation de I'ADN, la differentiation ou la mort cellulaire. Uexistence d'activites 
"p53-like" avait ete fortement pressentie avec la mise en evidence chez les souris 
P53-'*, d'activites de reparation de I'ADN et de mort cellulaire en reponse aux 
radiations ionisantes (Strasser et a/. # Cell, 1994. 79, 329-339). Les auteurs de la 
presente invention ont localise le g6ne SR-p70 humain dans la region telomerique du 
bras court du chromosome 1 ( precisement en 1p36.2-36.3, la plus petite region 
deletee (SRO) commune d une majortte de neuroblastomes et d'autres types de 
tumeurs (melanomes et carctnomes) (White et a/., PNAS. 1995. 92. 5520-5524). 
Cette region de perte d'heterozygotie (LOH) delimits le locus d'un gene suppresseur 
de tumeur dont la perte d'activit6 serait la cause de la formation des tumeurs. II est 
important de rappeler que cette region est egalement sujette a Tempreinte 
materneile* : ('allele matemel est preferentiellement perdu dans les neuroblastomes 
presentant la d6l*tton 1p36 (sans amplification de N-Myc) (Caron et a/.. Hum. Mol. 
Gen., 1995. 4. 535-539). Le gene sauvage SR-p70 introduit et exprime dans des 
cellules de neuroblastome permet la reversion de leur transformation. La perte de 
cette activity anti-oncoginique est done assoaee au developpement de la tumeur. La 
region 1p36 presente une homologie syngfcnique avec le segment distal du 
chromosome 4 de souris. Dans cette region a 6t6 localise le gene curly tail (ct) (Beier 
ef aL Mammalian Genome, 1995, 5, 269-272) implique dans les malformations 
cong6nitales du tube neural (MTN ; spkia bifida, anencephalie .). La souris cf est le 
meilleur module animal d'dtude de ces malformations. II est admis que ces 
malformations resultent d'anomalies de ta proliferation cellulaire. Compte tenu de la 
nature du gene SR-p70 et de sa localisation chromosomique. une des hypotheses est 
que le SR-p70 pourrait 6tre I'homologue humain de ct et qu'a ce titre, la detection des 
mutations precoces et les anomalies chromosomiques concemant ce gene devraient 
permettre par exemple comme application, identification des personnes a risques 
(0,5-1 % des nouveaux-n6s atteints par MTN). et la mise en oeuvre de traitements 
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prevents (Neumann et at.. Nature Genetics, 1994. 6. 357-362 ; Oi Vinci et a/., Int. J. 
Cancer, 1994, 59, 422-426 ; Moll etaL, PNAS. 1995, 92, 4407-4411 ; Chen et at.. 
Development, 1995, 121, 681-691). 



EXEMPLE XIV 

Etude allelique du gene SR-p70. 

Les alleles GC et AT sont identifies aisement par restriction Sty! des produits PCR de 
I'exon 2 (voir exemple XI). On a done pu determiner ainsi. chez des individus 
heterozygotes GC/AT et porteurs de tumeurs neuroblastomes. I'allele SR-p70 
perdu (GC ou AT) et cela malgre fa presence de tissu contaminant sain. 
D une fa$on surprenante, lorsque la mdme analyse est realises sur I'ARN, un seul 
allele est mis en evidence inddpendamment de presence ou non d une delation et 
plus surprenant encore, malgr* la presence de tissu sain. Cela suggere que 
i'empreinte (expression diffdrentielles des deux alleles) existerait egalement dans le 
tissu contaminant 

Pour le verifier, on a repute la meme analyse sur de I'ARN provenant des cellules 
sanguines d'individus sains hdttrozygotes GC/AT. Un seul des deux types de transcrit 
a ete detects egalement dans ces cellules. Ce resuttat confirme I'observation faite sur 
les echantillons tumoraux quant d ^existence d'une empreinte genetique generalises 
pour le gene SR-p70. 

Les implications de cette decouverte sont importantes puisqu elle permet de postuler 
qu'une seule mutation sporadique inactivant I'allele actif SR-p70 entralnera une perte 
d'activit* et cela potentiellement dans tous les tissus. 

L'absence de donnAes precises sur la fonction btologique SR-p70 ne permet pas de 
mesurer les consequences de cette perte d'activite SR-p70 pour la cellule. 
N6anmoins, sa forte homoiogie avec la proteine suppresseur de tumeur p53, ainsi 
que fa demonstration que la SR-p70 est un facteur de transcription capable d utiliser 
le promoteur P21**, suggere un r6le de cette proteine dans le controle du cycle 
ceflulaire et dans la differentiation. 

Knudson and Meadows 1980 (New Eng. J. Med. 302 :1254-56) considfcrent les 
neuroblastomes IV-S comme une collection de cellules non malignes de la crete 
neurale portant une mutation qui interfere avec leur diffdrencation normale. 
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II est concevable que la perte d'activite SR-p70 tout comme ta perte du contrdle p53 
sur te cycle cellulaire favorise rapparition d'anomalies cellulaires teiles que 
I'aneuploTdie, I'amplification (decrites dans le cas des neuroblastomas) et dautres 
remaniements genetiques pouvant provoquer la transformation cellulaire (Livingstone 
et al. 1992. Cell 71 :923-25 ; Yin et al. 1992, Cell 72:937-48; Cross et al. 1995, 
Science 267:1353-56; Fukasawa et al 1996, science 271:1744-47). Les 
neuroblastomes pourraient done provenir a leur origine d'une perte d'activite 
temporaire ou definitive de la SR-p70, favorisant ainsi rapparition d'evenements 
oncogeniques et done ta progression tumorale. 

Dans le cas de la delation constitutionnelle 1p36 dScrite par Biegel et al. 1993 (Am. J. 
Hum. Genet. 52 : 176-82), il y a bien apparition de neuroblastome IV-S, et te gene 
conceme est IMBS-1 (SR-p70). 

En conclusion, ce qui est decrit pour les neuroblastomes pourrait egalement 
sappliquer a d'autres types de tumeurs notamment ceux assodes a. des 
remaniements de I'extremite du bras court du chromosome 1 (report 2 international 
workshop on human chr 1 mapping 1995, Cytogenetics and Cell Genet 72 :113-154). 
Sur un plan thdrapeutique, Timplication de la SR-p70 dans rapparition de tumeurs 
devrait conduire a dviter ('utilisation d'agents mutagfcnes en chimiothdrapie, compte 
tenu des risques de transformation cellulaire par ces produits, et leur preferer des 
substances non mutagenes qui stimulent la differentiation. 

D'autre part, la frequence d'apparition des alleles GC et AT est la suivante : dans la 
population, Frequence(AT>0.15 et sur un echantilion de 25 patients 
(neuroblastomes), F(AT>0.30. Ces statistiques indrquent que I'aliete AT pourrait etre 
un facteur de predisposition. 
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LISTE DE SEQUENCES 



(1) INFORMATION GENERALS : 

(i) DEPOSANT: 

(A) NOM: sanofi 

(B) RUE: 32-34 rue Marbeuf 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75008 

(G) TELEPHONE: 01 53 77 40 00 

(H) TELECOPIE: 01 53 77 41 33 

(ii) TITRE DE L ' INVENTION: SR-p70 
(ill) NOMBRE DE SEQUENCES: 40 

<iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D ' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 



{2} INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERI S TIQUES DC LA SEQUENCE: 

<A) LONGUEUR: 2874 paires de bases 
<B> TYPE: acide nuclei que 
(C) NOMBRE DE BRINS: double 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN. 

(vi) ORIGINS: 

(A) ORGANISMS: Cebus ape 11a 

(ix) CARACTERI ST IQUE ADDITIONELLE: 

(A) NOM /CLE : CDS 

(B) EMPLACEMENT : 156.. 2066 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

TGCCTCCCCG CCCGCGCACC CGCCCCGAGG CCTGTGCTCC TGCGAAGGGG ACGCAGCGAA 60 

GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 12 0 

AGAGCGAGCT GCCCTCGGAG GCCGGTGTGA GGAAG ATG GCC CAG TCC ACC ACC 173 

Met Ala Gin Ser Thr Thr 
1 5 

ACC TCC CCC GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG 221 
Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu 
10 15 20 

GAA CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT 269 
Glu Pro Asp ser Thr Tyr Phe Asp Leu Pro Gin Ser ser Arg Gly Asn 
25 30 35 

AAT GAG GTG GTG GGT GGC ACG GAT TCC AGC ATG GAC GTC TTC CAC CTA 317 
Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu 
40 45 50 

GAG GGC ATG ACC ACA TCT GTC ATG GCC CAG TTC AAT TTG CTG AGC AGC 365 
Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser 
55 €0 65 70 

ACC ATG GAC CAG ATG AGC AGC CGC GOT GCC TCG GCC AGC CCG TAC ACC 413 
Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr 

75 80 85 
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CCG GAG CAC GCC GCC AGC GTG CCC ACC CAT TCA CCC TAC GCA CAG CCC 4 61 

Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro 
90 95 100 

AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 509 
Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn 
105 no 115 

ACC GAC TAT CCC GGA CCC CAC CAC TTC GAG GTC ACT TTC CAG CAG TCC 5 57 

Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser 
120 125 130 

AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCA CTC TTG AAG AAA 605 
Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys 
135 140 145 150 

CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC 653 
Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro He Gin He Lys Val Ser 
155 160 165 

GCC CCA CCG CCC CCG GGC ACC GCC ATC CGG GCC ATG CCT GTC TAC AAG 701 
Ala Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val Tyr Lys 
170 175 180 

AAG GCG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 74 9 

Lys Ala Glu His Val Thr Asp lie Val Lys Arg Cys Pro Asn His Glu 
185 190 195 

CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCC CCA GCC AGC CAC CTC 797 
Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu 
200 205 210 

ATC CGT GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAC GAC CCT GTC 845 
He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val 
215 220 225 230 

ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG 093 
Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly 
235 240 245 

ACA GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT 941 
Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser 5er Cys 
250 255 260 

GTG GGG GGC ATG AAC CGA CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG 989 
Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu 
265 270 275 

ACG CGG GAT GGG CAG GTG CTG CGC CGC CGG TCC TTC GAG GGC CGC ATC 1037 
Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He 
280 285 290 

TGC GCC TGT CCT GGC CGC GAC CGA AAA GCC GAT GAG GAC CAC TAC CGG 1085 
Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg 
295 300 305 310 

GAG CAG CAG GCC TTG AAT GAG AGC TCC GCC AAG AAC GGG GCT GCC AGC 1133 
Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser 
315 320 325 

AAG CGC GCC TTC AAG CAG AGT CCC CCT GCC GTC CCC GCC CTG GGC CCG 1181 
Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Pro 
330 335 340 

GOT GTG AAG AAG CGG CGG CAC GGA GAC GAG GAC ACG TAC TAC CTG CAG 1229 
Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin 
345 350 355 

GTG CGA GGC CGC GAG AAC TTC GAG ATC CTG ATG AAG CTG AAG GAG AGC 1277 
val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu Ser 
360 365 370 
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CTG GAG CTG ATG GAG TTG GTG CCG CAG CCG CTG GTA GAC TCC TAT CGG 1325 
Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tvr Ara 
375 380 365 390 

CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCA TCC 137 3 

Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser 
395 400 405 

TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC GTG AAC 1421 
Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val Asn 
410 415 420 

AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 14 69 

Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser 
425 430 435 

TCG GCA GCT ACA CCC AAC CTG GGA CCT GTG GGC TCT GGG ATG CTC AAC 1517 
Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Asn 
440 445 450 

AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC 1565 
Asn His Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His 
455 460 465 470 

GGC ACC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC 1613 
Gly Thr Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro 
475 480 485 

TAC CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG GGG TGT 1661 
Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys 
490 49S 500 

CCA AAC TGC ATC GAG TAT TTC ACG TCC CAG GGG TTA CAG AGC ATT TAC 1709 
Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser He Tyr 
505 510 515 

CAC CTG CAG AAC CTG ACC ATC GAG GAC CTG GGG GCC CTG AAG ATC CCC 1757 
His Leu Gin Asn Leu Thx He Glu Asp Leu Gly Ala Leu Lys He Pro 
520 525 530 

GAG CAG TAT CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG 1805 
Glu Gin Tyr Ara Met Thx He Trp Arg Gly Leu Gin Asp Leu Lys Gin 
535 540 545 550 

GGC CAC GAC TAC GGC GCC GCC GCG CAG CAG CTG CTC CGC TCC AGC AAC 1853 
Gly Hrs Asp Tyr Gly Ala Ala Ala Gin Gin Leu Leu Arg Ser Ser Asn 
555 560 565 

GCG GCC GCC ATT TCC ATC GGC GGC TCC GCG GAG CTG CAG CGC CAG CGG 1901 
Ala Ala Ala He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin Arg 
570 575 580 

GTC ATG GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC 1949 
Val Met Glu Ala Val His Phe Arg Val Arg His Thr He Thr He Pro 
585 590 595 

AAC CGC GGC GGC CCC GGC GCC GGC CCC GAC GAG TGG GCG GAC TTC GGC 1997 
Asn Arg Gly Gly Pro Gly Ala Gly Pro Asp Glu Trp Ala Asp Phe Gly 
600 SOS 610 

TTC GAC CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG GAG 2045 
Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He Lys Glu Glu 
615 620 625 630 

TTC ACG GAG GCC GAG ATC CAC TGAGGGGCCG GGCCCAGCCA GAGCCTGTGC 2096 
Phe Thr Glu Ala Glu He His 
635 



CACCGCCCAG AGACCCAGGC CGCCTCGCTC TCC TTC C TGT GTCCAAAACT GCCTCCGGAG 215 6 

GCAGGGCCTC CAGGCTGTGC CCGGGGAAAG GCAAGGTCCG GCCCATGCCC CGGCACCTCA 2216 
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CCGGCCCCAG GAGAGGCCCA GCCACCAAAG CCGCCTGCGG ACAGCCTGAG TCACCTGCAG 2276 

AACCTTCTGG AGCTGCCCTA ATGCTGGGCT TGCGGGGCAG GGGCCGGCCC AC7CTCAGCC 233 6 

CTGCCACTGC CGGGCGTGCT CCATGGCAGG CGTGGGTGGG GACCGCAGTG TCAGCTCCGA 2396 

CCTCCAGGCC TCATCCTAGA GACTCTGTCA TCTGCCGATC AAGCAAGGTC CTTCCAGAGG 245 6 

AAAGAATCCT CTTCGCTGGT GGACTGCCAA AAAGTATTTT GCGACATCTT TTGGTTCTGG 2516 

AGAGT GGTGA GCAGC C AAGC GACTGTGTCT GAAACACCGT GCATTTTCAG GGAATGTCCC 2576 

TAAC GGGC TG GGGACTCTCT CTGCTGGACT TGGGAGTGGC CTTTGCCCCC AGCACACTGT 2636 

ATTCTGCGGG ACCGCCTCCT TCCTGCCCCT AACAACCACC AAAGTGTTGC TGAAATTGGA 2696 

GAAAACTGGG GAAGGCGCAA CCCCTCCCAG GTGCGGGAAG CAT C TGGTAC CGCCTCGGCC 2756 

AGTGCCCCTC AGCCTGGCCA CAGTCACCTC TCCTTGGGGA ACCCTGGGCA GAAAGGGACA 2816 

GCCTGTCCTT AGAGGACCGG AAATTGTCAA TATTTGATAA AATGATACCC TTTTCTAC 2 874 

(2) INFORMATION POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 637 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

£ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

Met Ala Gin Ser Thr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
1 5 io 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 70 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 9 5 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 no 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 

135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 150 155 i 6 o 

He Gin He Lys Val Ser Ala Pro Pro Pro Pro Gly Thr Ala He Arci 
165 170 i7 5 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp lie Val Lys 
180 105 190 

Arg cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
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195 200 m 205 

Ala Pro Ala Ser His Leu lie Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

lie He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 265 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
30S 310 31S 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Sex Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Ser Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Ser 
450 455 460 

Glu Met Thr Ser Ser His Gly Thr Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
485 490 495 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
500 505 510 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
515 520 52S 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly 
530 535 540 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Gly Ala Ala Ala Gin Gin 
S4S 550 555 560 

Leu Leu Arg Ser Ser Asn Ala Ala Ala He Ser He Gly Gly Ser Gly 
565 570 575 

Glu Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg 
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560 585 590 

His Thr lie Thr lie Pro Asn Arg Gly Gly Pro Gly Ala Gly Pro Asp 
595 600 605 

Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys 
610 615 620 

Gin Pro lie Lys Glu Glu Phe Thr Glu Ala Glu lie His 
625 630 635 

(2) INFORMATION POUR LA SEQ ID NO: 3: 

(i) CARACTSRISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2034 paires de bases 

(B) TYPE: acide nucleique 

(C) N OMBRE DE BRXN5 : double 
(d; configuration: lineaire 

<ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE : 

(A) CRGANISME: Cebus apella 

(ix> CARACTERISTIQUE ADDITIONELLE: 
(A) NOM/CLE: CDS 
<B) EMPLACEMENT: 156.. 1652 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

TGCCTCCCCG CCCGCGCACC CGCCCCGAGG CCTGTGCTCC TGCGAAGGGG ACGCAGCGAA 60 

GCCGGGGCCC GCGCCAGGCC GGCCGGGACG GACGCCGATG CCCGGAGCTG CGACGGCTGC 120 

AGAGC GAGCT GCCCTCGGAG GCCGGTGTGA GGAAG ATG GCC CAG TCC ACC ACC 173 

Met Ala Gin Ser Thr Thr 
1 5 

ACC TCC CCC GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG 221 
Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu 
10 15 20 

GAA CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT 2 69 

Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn 
25 30 35 

AAT GAG GTG GTG GGT GGC ACG GAT TCC AGC ATG GAC GTC TTC CAC CTA 317 
Asn Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu 
4 ° 45 so 

GAG GGC ATG ACC ACA TCT GTC ATG GCC CAG TTC AAT TTG CTG AGC AGC 365 
Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser 
35 60 65 70 

ACC ATG GAC CAG ATG AGC AGC CGC GCT GCC TCG GCC AGC CCG TAC ACC 413 
Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro Tyr Thr 
7 5 80 85 

r^f. u AC ^7° ^ C GTG CCC ACC <=« TCA CCC TAC GCA CAG CCC 4 61 

Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro 

90 95 100 

AGC TCC ACC TTC GAC ACC ATG TCG CCC GCG CCT GTC ATC CCC TCC AAC 509 
Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val He Pro Ser Asn 
105 110 us 

Thr a™ l M l CC ^f A CCC 0X0 TTC GAG GTC ACT TTC CAG CAG TCC 557 

Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser 
120 125 130 

AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCA CTC TTG AAC AAA 60S 
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Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys 
135 140 * 145 150 

CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC 653 
Leu Tyr Cya Gin lie Ala Lys Thr Cys Pro lie Gin He Lys Val Ser 
155 160 165 

GCC CCA CCG CCC CCG GGC ACC GCC ATC CGG GCC ATG CCT GTC TAC AAG 701 
Ala Pro Pro Pro Pro Gly Thr Ala lie Arg Ala Met Pro Val Tyr Lys 
170 175 180 

AAG GCG GAG CAC GTG ACC GAC ATC GTG AAG CGC TGC CCC AAC CAC GAG 74 9 

Lys Ala Glu His Val Thr Asp lie Val Lys Arg Cys Pro Asn His Glu 
185 190 195 

CTC GGG AGG GAC TTC AAC GAA GGA CAG TCT GCC CCA GCC AGC CAC CTC 797 
Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser His Leu 
200 205 210 

ATC CGT GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAC GAC CCT GTC 84 5 

He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val 
215 220 225 230 

ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG 893 
Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly 
235 240 245 

ACA GAA TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC AGC TGT 941 
Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys 
250 255 260 

GTG GGG GGC ATG AAC CGA CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG 989 
Val Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu 
265 270 275 

ACG CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTC GAG GGC CGC ATC 1037 
Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He 
280 285 290 

TGC GCC TGT CCT GGC CGC GAC CGA AAA GCC GAT GAG GAC CAC TAC CGG 1085 
Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg 
295 300 305 310 

GAG CAG CAG GCC TTG AAT GAG AGC TCC GCC AAG AAC GGG GCT GCC AGC 1133 
Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser 
315 320 325 

AAG CGC GCC TTC AAG CAG AGT CCC CCT GCC GTC CCC GCC CTG GGC CCG 1181 
Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Pro 
330 335 340 

GGT GTG AAG AAG CGG CGG CAC GGA GAC GAG GAC ACG TAC TAC CTG CAG 1229 
Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin 
345 350 355 

GTG CGA GGC CGC GAG AAC TTC GAG ATC CTG ATG AAG CTG AAG GAG AGC 1277 
Val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu Ser 
360 365 370 

CTG GAG CTG ATG GAG TTG GTG CCG CAG CCG CTG GTA GAC TCC TAT CGG 1325 
Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Arg 
375 380 385 390 

CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC CCA TCC 1373 
Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser 
395 400 405 

TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC GTG AAC 1421 
Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Val Asn 
410 415 420 

AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGC 14 69 
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Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser 
425 430 . 435 

TCG GCA GCT ACA CCC AAC CTG GGA CCT GTG GGC TCT GGG ATG CTC AAC 1517 
Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Ser Gly Met Leu Asn 
440 445 450 

AAC CAC GGC CAC GCA GTG CCA GCC AAC AGC GAG ATG ACC AGC AGC CAC 15 65 

Asn His Gly His Ala Val Pro Ala Asn Ser Glu Met Thr Ser Ser His 
455 460 465 470 

GGC ACC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC 1613 
Gly Thr Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro 
475 480 485 

TAC CAC GCC GAC CCC AGC CTC GTC AGG ACC TGG GGG CCC TGAAGATCCC 1662 
Tyr His Ala Asp Pro Ser Leu Val Arg Thr Trp Gly Pro 
490 495 

CGAGCAGTAT CGCATGACCA TCTGGCGGGG CCTGCAGGAC CTGAAGCAGG GCCACGACTA 1722 

CGGCGCCGCC GC GC AGC AGC TGCTCCGCTC CAGCAACGCG GCCGCCATTT C CATC GGC GG 1782 

CTCCGGGGAG CTGCAGCGCC AGC GGGT CAT GGAGGCCGTG CACTTCCGCG TGCGCCACAC 1842 

CATCACCATC CCCAACCGCG GCGGCCCCGG CGCCGGCCCC GACGAGTGGG CGGACTTCGG 1902 

CTTCGACCTG CCCGACTGCA AGGCCCGCAA GCAGCCCATC AAGGAGGAGT TCACGGAGGC 1962 

CGAGATCCAC TGAGGGGCCG GGCCCAGCCA GAGCCTGTGC CAC C GCC CAG AGACCCAGGC 2022 

CGCCTCGCTC TC 



C2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
<A> LONGUEUR: 499 acides amines 
(B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Ala Gin Ser Thr Thr Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
15 10 15 

His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 

20 25 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 ™ 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
1°0 105 no 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
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Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 

160 



145 150 155 



He Gin He Lys Val Sec Ala Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp He Val Lys 
190 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Fhe Asn Glu Gly Gin Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Mec Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Pro Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
395 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
435 440 445 

Gly Ser Gly Met Leu Aan Aan His Gly His Ala Val Pro Ala Asn Ser 
450 455 460 

Glu Met Thr Ser Ser His Gly Thr Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr 
485 490 495 

Trp Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 5: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2156 paires de bases 
<B) TYPE: acide nucleigue 
(C) N OMBRE DE BRINS : double 
(D> CONFIGURATION: lin6aire 

(ii) TYPE DE MOLECULE: ADNc 

<vi) ORIGINS: 

(A) ORGAN IS ME : Homo sapiens 

tix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 33.. 1940 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: S: 

GCGAGCTGCC CTCGGAGGCC GGCGTGGGGA AG ATG GCC CAG TCC ACC GCC ACC 53 

Met Ala Gin Ser Thr Ala Thr 
1 5 

TCC CCT GAT GGG GGC ACC ACG TTT GAG CAC CTC TGG AGC TCT CTG GAA 101 
Ser Pro Asp Gly Gly Thr Thr Phe Glu His Leu Trp Ser Ser Leu Glu 
10 15 20 

CCA GAC AGC ACC TAC TTC GAC CTT CCC CAG TCA AGC CGG GGG AAT AAT 149 
Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Ser Ser Arg Gly Asn Asn 
25 30 35 

GAG GTG GTG GGC GGA ACG GAT TCC AGC ATG GAC GTC TTC CAC CTG GAG 197 
Glu Val Val Gly Gly Thr Asp Ser Ser Met Asp Val Phe His Leu Glu 
40 45 50 55 

GGC ATG ACT ACA TCT GTC ATG GCC CAG TTC AAT CTG CTG AGC AGC ACC 245 
Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu Ser Ser Thr 
60 65 70 

ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CCC TAC ACC CCA 293 
Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala ser Pro Tyr Thr Pro 
75 80 85 

GAG CAC GCC GCC AGC GTG CCC ACC CAC TCG CCC TAC GCA CAA CCC AGC 341 
Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala Gin Pro Ser 
90 95 100 

TCC ACC TTC GAC ACC ATG TCG CCG GCG CCT GTC ATC CCC TCC AAC ACC 389 
ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val lie Pro Ser Asn Thr 
105 no us 

GAC TAC CCC GGA CCC CAC CAC TTT GAG GTC ACT TTC CAG CAG TCC AGC 437 
Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin Gin Ser Ser 
120 125 130 135 

ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCG CTC TTG AAG AAA CTC 
Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu Lys Lys Leu 
140 145 iso 

TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG GTG TCC ACC S33 
Tyr Cys Gin lie Ala Lys Thr Cys Pro lie Gin lie Lys Val Ser Thr 
iS5 160 165 



485 



581 



CCG CCA CCC CCA GGC ACT GCC ATC CGG GCC ATG CCT GTT TAC AAG AAA 
Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val Tyr Lys Lys 
170 175 180 

All* ^° ? AC GT ? GTG CGC TGC CCC CAC GAG CT <= 629 

Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn His Glu Leu 
185 190 195 

CGG AGG GAC TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC CAC CTC ATC 677 
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Gly Arg Asp Phe Aan Glu Gly Gin Sox Ala Pro Ala Ser His Leu lie 
200 205 210 215 

CGC GTG GAA GGC AAT AAT CTC TCG CAG TAT GTG GAT GAC CCT GTC ACC 725 
Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr Val Asp Asp Pro Val Thr 
220 225 230 

GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG GTG GGG ACG 773 
Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro Pro Gin Val Gly Thr 
235 240 245 

GAA TTC ACC ACC ATC CTG TAG AAC TTC ATG TGT AAC AGC AGC TGT GTA 321 
Glu Phe Thr Thr He Leu Tyr Asn Phe Met Cys Asn Ser Ser Cys Val 
250 255 260 

GGG GGC ATG AAC CGG CGG CCC ATC CTC ATC ATC ATC ACC CTG GAG ATG 8 69 

Gly Gly Met Asn Arg Arg Pro He Leu He He He Thr Leu Glu Met 
265 270 275 

CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTT GAG GGC CGC ATC TGC 917 
Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe Glu Gly Arg He Cys 
280 285 290 295 

GCC TGT CCT GGC CGC GAC CGA AAA GCT GAT GAG GAC CAC TAC CGG GAG 965 
Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His Tyr Arg Glu 
300 305 310 

CAG CAG GCC CTG AAC GAG AGC TCC GCC AAG AAC GGG GCC GCC AGC AAG 1013 
Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala Ala Ser Lys 
315 320 325 

CGT GCC TTC AAG CAG AGC CCC CCT GCC GTC CCC GCC CTT GGT GCC GGT 1061 
Arg Ala Phe Lys Gin Ser Pro Pro Ala Val Pro Ala Leu Gly Ala Gly 
330 335 340 

GTG AAG AAG CGG CGG CAT GGA GAC GAG GAC ACG TAC TAC CTT CAG GTG 1109 
Val Lys Lys Arg Arg His Gly Asp Glu Asp Thr Tyr Tyr Leu Gin Val 
345 350 355 

CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG AAA GAG AGC CTG 1157 
Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys Leu Lys Glu Ser Leu 
360 365 370 375 

GAG CTG ATG GAG TTG GTG CCG CAG CCA CTG GTG GAC TCC TAT CGG CAG 1205 
Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser Tyr Axg Gin 
380 385 390 

CAG CAG CAG CTC CTA CAG AGG CCG ACT CAC CTA CAG CCC CCG TCC TAC 1253 
Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro Pro Ser Tyr 
395 400 405 

GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC ATG AAC AAG 1301 
Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly Met Asn Lys 
410 415 420 

CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG CAC AGT TCG 1349 
Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro His Ser Ser 
425 430 435 

GCA GCT ACA CCC AAC CTG GGG CCC GTG GGC CCC GGG ATG CTC AAC AAC 1397 
Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met Leu Asn Asn 
440 445 450 4S5 

CAT GGC CAC GCA GTG CCA GCC AAC GGC GAG ATG AGC AGC AGC CAC AGC 1445 
His Gly His Ala Val Pro Ala Asn Gly Glu Met Ser Ser Ser His Ser 
460 465 470 

GCC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA CCC CCC TAC 14 93 

Ala Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro Pro Pro Tyr 
475 480 485 

CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG GGG TGT CCA 1541 
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His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu Gly Cys Pro 
490 495 " 500 

AAC TGC ATC GAG TAT TTC ACC TCC CAA GGG TTA CAG AGC ATT TAC CAC 
Asn Cys He Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser He Tyr His 
505 510 515 

CTG CAG AAC CTG ACC ATT GAG GAC CTG GGG GCC CTG AAG ATC CCC GAG 
Leu Gin Asn Leu Thr He Glu Asp Leu Gly Ala Leu Lys lie Pro Glu 
520 525 530 535 

CAG TAC CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG AAG CAG GGC 
Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin Asp Leu Lys Gin Gly 
540 545 550 

CAC GAC TAC AGC ACC GCG CAG CAG CTG CTC CGC TCT AGC AAC GCG GCC 
His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg Ser Ser Asn Ala Ala 
555 560 565 

ACC ATC TCC ATC GGC GGC TCA GGG GAA CTG CAG CGC CAG CGG GTC ATG 
Thr He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin Arg Val Met 
570 575 580 

GAG GCC GTG CAC TTC CGC GTG CGC CAC ACC ATC ACC ATC CCC AAC CGC 
Glu Ala Val His Phe Arg Val Arg His Thr He Thr He Pro Asn Ara 
585 590 595 

GGC GGC CCA GGC GGC GGC CCT GAC GAG TGG GCG GAC TTC GGC TTC GAC 
Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala Asp Phe Gly Phe Asp 
600 60S 610 615 

CTG CCC GAC TGC AAG GCC CGC AAG CAG CCC ATC AAG GAG GAG TTC ACG 
Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He Lys Glu Glu Phe Thr 
620 625 630 

GAG GCC GAG ATC CAC TGAGGGCCTC GCCTGGCTGC AGCCTGCGCC ACCGCCCAGA 
Glu Ala Glu He His 
635 

GACCCAAGCT GCCTCCCCTC TCCTTCCTGT GTGTCCAAAA CTGCCTCAGG AGGCAGGACC 
TTCGGGCTGT GCCCGGGGAA AGGCAAGGTC CGGCCCATCC CCAGGCACCT CACAGGCCCC 
AGGAAAGGCC CAGCCACCGA AGCCGCCTGT GGACAGCCTG AGTCACCTGC AGAACC 



(2) INFORMATION POUR IA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 636 acides amines 

(B) TYPE : aci.de amine 

<D> CONFIGURATION: lineaire 

<ii> TYPE DE MOLECULE: proteine 

txi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

let Ala Gin Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
15 10 15 

ris Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 25 30 

rln Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

let Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 



1589 

1637 

1685 

1733 

1781 

1829 

1877 

1925 

1980 

2040 
2100 
2156 



55 



60 



Phe Asn 

65 



Leu Leu 



Ser Ser 
70 



Thr 



Met Asp 



Gin Met Ser 
75 



Ser 



Arg Ala 



Ala 
80 
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Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Vai Pro Thr His 
65 " 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 110 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
115 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
130 135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 150 155 160 

lie Gin lie Lys Val Ser Thx Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lya Ala Glu His Val Thr Asp Val Val Lys 
180 185 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
275 260 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Axg Aap Arg Lys Ala 
290 295 300 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu ser Ser Ala 
305 310 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
365 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Am Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Aan Leu Gly Pro Val 
435 440 445 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
450 455 460 
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Glu Mec Ser Ser Ser His Sec Ala Gin Ser Met Val Ser Gly Ser His 
465 470. 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
465 490 495 

Leu Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin 
500 505 510 

Gly Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr lie Glu Asp Leu 
515 520 S25 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr lie Trp Arg Gly 
530 535 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu 
545 550 555 560 

Leu Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
565 570 S75 

Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
560 585 590 

Thr He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 
595 600 60S 

TrP ASp Phe Gly Phe A3p Leu Pro Asp C Y 3 Z Y S Ala Arg Lys Gin 

610 615 620 

Pro He Lys Glu Glu Phe Thr Glu Ala Glu He His 
625 630 635 

(2) INFORMATION POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2040 paires de bases 

(B) TYPE: acide nucleique 
<C) NOMBRE DE BR INS: double 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISMS: Mua mus cuius 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT: 124.. 1890 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
TGATCTCCCT GTGGCCTGCA GGGGACTGAG CCAGGGAGTA GATGCCCTGA GACCCCAAGG 60 
GACAC C CAAG GAAACCTTGC TGGCTTTGAG AAAGGGATCG TCTCTCTCCT GCCCAAGAGA 120 

AGC mI? J" " G CCT GTG TAT GAA TCC TTG GGG CAG GCC CAG TTC 168 

Met Cys Met Gly Pro Val Tyr Glu Ser Leu Gly Gin Ala Gin Phe 
1 5 10 15 

" G HI AGC AGT GCC ATG GAC CAG ATG GGC AGC CGT GCG GCC CCG 216 
Asn Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro 
20 25 30 

GCG AGC CCC TAG ACC CCG GAG CAC GCC GCC AGC GCG CCC ACC CAC TCC 
Ala ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ma Pro ™r 5£ ser 
-» 5 40 45 

Pro Jvr £a ^ p CC I CC ACC TTC GAC ACC ATG TCT CCG GCG CCT 

Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 

30 55 60 



264 



312 
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GTC ATC CCT TCC AAT ACC GAC TAC CCC GGC CCC CAC CAC TTC GAG GTC 363 
Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val 
65 70 75 

ACC TTC CAG CAG TCG AGC ACT GCC AAG TCG GCC ACC TGG ACA TAC TCC 408 
Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser 
80 85 90 95 

CCA CTC TTG AAG AAG TTG TAC TGT CAG ATT GCT AAG ACA TGC CCC ATC 45 6 

Pro Leu Leu Lya Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro He 
100 105 110 

CAG ATC AAA GTG TCC ACA CCA CCA CCC CCG GGC ACG GCC ATC CGG GCC 504 
Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala 
115 120 125 

ATG CCT GTC TAC AAG AAG GCA GAG CAT GTG ACC GAC ATT GTT AAG CGC 552 
Met Pro Val Tyr Lya Lys Ala Glu Hia Val Thr Aap He Val Lys Arg 
130 135 140 

TGC CCC AAC CAC GAG CTT GGA AGG GAC TTC AAT GAA GGA CAG TCT GCC 600 
Cys Pro Aan Hia Glu Leu Gly Arg Aap Phe Asn Glu Gly Gin Ser Ala 
145 150 155 

CCG GCT AGC CAC CTC ATC CGT GTA GAA GGC AAC AAC CTC GCC CAG TAC 64 8 

Pro Ala Ser Hia Leu He Arg Val Glu Gly Aan Asn ieu Ala Gin Tyr 
160 165 170 175 

GTG GAT GAC CCT GTC ACC GGA AGG CAG AGT GTG GTT GTG CCG TAT GAA 696 
Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 

CCC CCA CAG GTG GGA ACA GAA TTT ACC ACC ATC CTG TAC AAC TTC ATG 744 
Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Aan Phe Met 
195 200 205 

TGT AAC AGC AGC TGT GTG GGG GGC ATG AAT CGG AGG CCC ATC CTT GTC 792 
Cys Asn Ser Ser Cya Val Gly Gly Met Aan Arg Arg Pro He Leu Val 
210 215 220 

ATC ATC ACC CTG GAG ACC CGG GAT GGA CAG GTC CTG GGC CGC CGG TCT 840 
He He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 

TTC GAG GGT CGC ATC TGT GCC TGT CCT GGC CGT GAC CGC AAA GCT GAT 888 
Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Aap Arg Lys Ala Asp 
240 245 250 25S 

GAA GAC CAT TAC CGG GAG GAA CAG GCT CTG AAT GAA AGT ACC ACC AAA 936 
Glu Aap His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Thr Thr Lya 
260 265 270 

AAT GGA GCT GCC AGC AAA CGT GCA TTC AAG CAG AGC CCC CCT GCC ATC 984 
Aan Gly Ala Ala Ser Lya Arg Ala Phe Lys Gin Ser Pro Pro Ala He 
275 280 285 

CCT GCC CTG GGT ACC AAC GTG AAG AAG AGA CGC CAC GGG GAC GAG GAC 1032 
Pro Ala Leu Gly Thr Aan Val Lya Lys Arg Arg His Gly Aap Glu Aap 
290 295 300 

ATG TTC TAC ATG CAC GTG CGA GGC CGG GAG AAC TTT GAG ATC TTG ATG 108 0 

Met Phe Tyr Met His Val Arg Gly Arg Glu Aan Phe Glu He Leu Met 
305 310 315 

AAA GTC AAG GAG AGC CTA GAA CTG ATG GAG CTT GTG CCC CAG CCT TTG 1128 
Lys Val Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
320 325 330 335 

GTT GAC TCC TAT CGA CAG CAG CAG CAG CAG CAG CTC CTA CAG AGG CCG 1176 
Val Aap Ser Tyr Arg Gin Gin Gin Gin Gin Gin Leu Leu Gin Arg Pro 
340 345 350 
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AGT CAC CTG CAG CCT CCA TCC TAT GGG CCC GTG CTC TCC CCA ATG AAC 1224 
Ser His Leu Gin Pro pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn 
355 360 365 

AAG GTA CAC GGT GGT GTC AAC AAA CTG CCC TCC GTC AAC CAG CTG GTG 1272 
Lys Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val 
370 375 380 

GGC CAG CCT CCC CCG CAC AGC TCA GCA GCT GGG CCC AAC CTG GGG CCC 1320 
Gly Gin Pro Pro Pro His Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro 
365 390 395 

ATG GGC TCC GGG ATG CTC AAC AGC CAC GGC CAC AGC ATG CCG GCC AAT 1368 
Met Gly Ser Gly Met Leu Asn Ser His Gly His Ser Met Pro Ala Asn 
400 405 410 415 

GGT GAG ATG AAT GGA GGC CAC AGC TCC CAG ACC ATG GTT TCG GGA TCC 1416 
Gly Glu Met Asn Gly Gly His Ser Ser Gin Thr Met Val Ser Gly Ser 
420 425 430 

CAC TGC ACC CCG CCA CCC CCC TAT CAT GCA GAC CCC AGC CTC GTC AGT 14 64 

His Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser 
435 440 445 

TTT TTG ACA GGG TTG GGG TGT CCA AAC TGC ATC GAG TGC TTC ACT TCC 1512 
Phe Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Cys Phe Thr Ser 
450 455 460 

CAA GGG TTG CAG AGC ATC TAC CAC CTG CAG AAC CTT ACC ATC GAG GAC 1560 
Gin Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp 
465 470 475 

CTT GGG GCT CTG AAG GTC CCT GAC CAG TAC CGT ATG ACC ATC TGG AGG 1608 
Leu Gly Ala Leu Lys Val Pro Asp Gin Tyr Arg Met Thr lie Trp Ara 
480 485 490 495 

GGC CTA CAG GAC CTG AAG CAG AGC CAT GAC TGC GGC CAG CAA CTG CTA 1656 
Gly Leu Gin Asp Leu Lys Gin Ser His Asp Cys Gly Gin Gin Leu Leu 
500 505 510 

CGC TCC AGC AGC AAC GCG GCC ACC ATC TCC ATC GGC GGC TCT GGC GAG 1704 
Arg Ser Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
515 520 525 

CTG CAG CGG CAG CGG GTC ATG GAA GCC GTG CAT TTC CGT GTG CGC CAC 1752 
Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Ara His 
530 53S 540 

** C ATC CCC AAC CGT GGA GGC GCA GGT GCG GTG ACA GGT CCC 1800 

Thr He Thr He Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro 
545 550 555 

GAC GAG TGG GCG GAC TTT GGC TTT GAC CTG CCT GAC TGC AAG TCC CGT 1848 
Asp Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ser Arg 
560 565 570 575 



1890 



AAG CAG CCC ATC AAA GAG GAG TTC ACA GAG ACA GAG AGC CAC 
Lys Gin Pro He Lys Glu Glu Phe Thr Glu Thr Glu Ser His 
580 585 

TGAGGAACGT ACCTTCTTCT CCTGTCCTTC CTCTGTGAGA AAC TGC T CTT GGAAGTGCGA 1950 

CCTGTTGGCT GTGCCCACAG AAACCAGCAA GGACCTTCTG CCGGATGCCA TTCCTGAAGG 2010 

GAAGTCGCTC ATGAACTAAC TCCCTCTTGG 



2040 



(2) INFORMATION POUR LA SEQ ID NO: 8: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 589 acides amines 
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(B) TYPE: acide amine 

( D) CONFIGURATION: lineaire 

(iii TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Cys Met Gly Pro Val Tyr Glu Ser Leu Gly Gin Ala Gin Phe Asn 
IS 10 15 

Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro Ala 
20 25 30 

Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser Pro 
35 40 45 

Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val 
50 55 60 

lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr 
65 70 75 80 

Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro 
85 90 95 

Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro lie Gin 
100 105 HO 

lie Lys Val ser Thr Pro Pro Pro Pro Gly Thr Ala lie Arg Ala Met 
115 120 125 

Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp lie Val Lys Arg Cys 
130 135 140 

Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro 
145 150 155 160 

Ala Ser His Leu lie Arg Val Glu Gly Asn Asn Leu Ala Gin Tyr Val 
165 170 175 

Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu Pro 
180 185 190 

Pro Gin Val Gly Thr Glu Phe Thr Thr lie Leu Tyr Asn Phe Met Cys 
195 200 205 

Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu Val He 
210 215 220 

He Thr Leu Glu Thr Arg Asp Gly Gin Val Leu Gly Arg Arg Ser Phe 
225 230 235 240 

Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu 
245 250 255 

Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Thr Thr Lys Asn 
260 265 270 

Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala He Pro 
275 280 285 

Ala Leu Gly Thr Asn Val Lys Lys Arg Arg His Gly Asp Glu Asp Met 
290 295 300 

Phe Tyr Met His Val Arg Gly Arg Glu Asn Phe Glu He Leu Met Lys 
305 310 315 320 

Val Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val 
325 330 335 

Asp Ser Tyr Arg Gin Gin Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
340 345 350 
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His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
355 360 365 

Val His Gly Gly Val Asn Lys Leu Pro Ser Val Asn Gin Leu Val Glv 
370 375 380 

Gin Pro Pro Pro His Ser Ser Ala Ala Gly Pro Asn Leu Gly Pro Met 
385 390 395 400 

Gly Ser Gly Met Leu Asn Ser His Gly His Ser Met Pro Ala Asn Gly 
405 410 415 

Glu Met Asn Gly Gly His Ser Ser Gin Thr Met Val Ser Gly Ser His 
420 425 430 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
435 440 445 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Cys Phe Thr Ser Gin 
450 455 460 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
465 470 475 480 

Gly Ala Leu Lys Val Pro Asp Gin Tyr Arg Met Thr He Trp Arg Gly 
485 490 495 

Leu Gin Asp Leu Lys Gin Ser His Asp Cys Gly Gin Gin Leu Leu Ara 
500 505 510 

Ser Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu 
515 520 S25 

Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr 
530 535 540 

He Thr He Pro Asn Arg Gly Gly Ala Gly Ala Val Thr Gly Pro Asp 
545 550 555 560 

Glu Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ser Arg Lys 
565 570 575 

Gin Pro He Lys Glu Glu Phe Thr Glu Thr Glu Ser His 
580 595 

(2) INFORMATION POUR LA SEQ ID NO: 9: 

(X) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 758 paires de bases 

(B) TVPE: acide nuclei que 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINS: 

(A) ORGANISMS: Mus mus cuius 

fix) CARACTZRISTIQUE ADDITIONELLE : 
(A) NOM/CLE: CDS 
(BJ EMPLACEMENT: 389.. 757 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
TGGTCCCGCT TCGACCAAGA CTCCGGCTAC CAGCTTGCGG GCCCCGCGGA GGAGGAGACC 
CCGCTGGGGC TAGCTGGGCG ACGCGCGCCA AGCGGCGGCG GGAAGGAGGC GGGAGGAGCG 
GGGC C CGAGA CCCCGACTCG GGCAGAGCCA GCTGGGGAGG CGGGGCGCGC GTGGGAGCCA 



60 
120 
180 
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GGGGCCCGGG TGGCCGGCCC TCCTCCGCCA CGGCTGAGTG CCCGCGCTGC CTTCCCGCCG 2 40 

GTCCGCCAAG AAAGGCGC7A AGCCTGCGGC AGTCCCCTCG CCGCCGCCTC CCTGCTCCGC 300 

ACCCTTATAA CCCGCCGTCC CGCATCCAGG CGAGGAGGCA ACGCTGCAGC CCAGCCCTCG 360 

CCGACGCCGA CGCCCGGCCC GGAGCAGA ATG AGC GGC AGC GTT GGG GAG ATG 412 

Met Ser Gly Ser Val Gly Glu Met 
1 5 

GCC CAG ACC TCT TCT TCC TCC TCC TCC ACC TTC GAG CAC CTG TGG AGT 4 60 

Ala Gin Thr Ser Ser Ser Ser Ser Ser Thr Phe Glu His Leu Trp Ser 
10 15 20 

TCT CTA GAG CCA GAC AGC ACC TAC TTT GAC CTC CCC CAG CCC AGC CAA 508 
Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro Gin Pro Ser Gin 
25 30 35 40 

GGG ACT AGC GAG GCA TCA GGC AGC GAG GAG TCC AAC ATG GAT GTC TTC 556 
Gly Thr Ser Glu Ala Ser Gly ser Glu Glu Ser Asn Met Asp Val Phe 
45 50 55 

CAC CTG CAA GGC ATG GCC CAG TTC AAT TTG CTC AGC AGT GCC ATG GAC 604 
His Leu Gin Gly Met Ala Gin Phe Asn Leu Leu Ser Ser Ala Met Asp 
60 65 70 

CAG ATG GGC AGC CGT GCG GCC CCG GCG AGC CCC TAC ACC CCG GAG CAC 652 
Gin Met Gly Ser Axg Ala Ala Pro Ala Ser Pro Tyr Thr Pro Glu His 
75 80 85 

GCC GCC AGC GCG CCC ACC CAC TCG CCC TAC GCG CAG CCC AGC TCC ACC 700 
Ala Ala Ser Ala Pro Thr His Ser Pro Tyr Ala Gin Pro Ser Ser Thr 
90 95 100 

TTC GAC ACC ATG TCT CCG GCG CCT GTC ATC CCT TCC AAT ACC GAC TAC 748 
Phe Asp Thr Met Ser Pro Ala Pro Val lie Pro Ser Asn Thr Asp Tyr 
105 HO 115 120 



CCC GGC CCC C 
Pro Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DB LA SEQUENCE : 
(A) LONGUEUR: 123 aeides amines 
<B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: protein* 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Ser Gly Ser Val Gly Glu Met Ala Gin Thr Ser Ser Ser Ser Ser 
1 5 10 15 

Ser Thr Phe Glu His Leu Trp Ser Ser Leu Glu Pro Asp Ser Thr Tyr 
20 25 30 

Phe Asp Leu Pro Gin Pro Ser Gin Gly Thr Ser Glu Ala Ser Gly Ser 
35 40 45 

Glu Glu Ser Asn Met Asp Val Phe His Leu Gin Gly Met Ala Gin Phe 
50 55 60 

Asn Leu Leu Ser Ser Ala Met Asp Gin Met Gly Ser Arg Ala Ala Pro 
65 70 75 80 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Ala Pro Thr His Ser 
85 90 95 



758 
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Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
100 10S no 

Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro 
US 120 

<2) INFORMATION POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DC LA SEQUENCE: 

(A) LONGUEUR: 559 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : double 
{DJ CONFIGURATION: lineaire 

<ii> TYPE DE MOLECULE : ADNc 

(vi) ORIGINE: 

(A) ORGANISMS: Homo sapiens 

(xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
CGACCTTCCC CAGTCAAGCC GGGGGAATAA TGAGGTGGTG GGCGGAACGG ATTCCAGCAT 60 
GGACGTC T T C CACCTGGAGG GCATGACTAC ATCTGTCATG CATCCTCGGC TCCTGCCTCA 
CTAGCTGCGG AGCCTCTCCC GCTC GGTCCA CGCTGCCGGG CGGCCACGAC CGTGACCCTT 
CCCCTCGGGC CGCCCAGATC CATGCCTCGT CCCACGGGAC ACCAGTTCCC TGGCGTGTGC 240 
AGACCCCCCG GCGCCTACCA TGCTGTACGT CGGTGACCCC GCACGGCACC TCGCCACGGC 300 
CCAGTTCAAT CTGCTGAGCA GC AC CAT GG A CCAGATGAGC AGCCGCGCGG CCTCGGCCAG 
CCCCTACACC CCAGAGCACG CCGCCAGCGT GCCCACCCAC TCGCCCTACG CACAACCCAG 
CTCCACCTTC GACACCATGT CGCCGGCGCC TGTCATCCCC TCCAACACCG ACTACCCCGG 480 
ACCCCACCAC TTTGAGGTCA CTTTCCAGCA GTCCAGCACG GCCAAGTCAG CCACCTGGAC 540 
GTACTCCCCG CTCTTGAAG 

(2) INFORMATION POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17S4 paires de bases 
<B> TYPE: acide nucleique 
(C) NOMBRE DE BRINS: double 
(D> CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISMS: Homo sapiens 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
ATGC TGTAC G TCGGTGACCC CGCACGGCAC CTCGC CAC GG CCCAGTTCAA TCTGCTGAGC 
AGCACCATGG ACCAGATGAG CAGCCGCGCG GCCTCGGCCA GCCCCTACAC CCCAGAGCAC 
GCCGCCAGCG TGCCCACCCA CTCGC CCTAC GCACAACCCA GCTCCACCTT CGACACCATG 
TCGCCGGCGC CTGTCATCCC CTCCAACACC GACTACCCCG GACCCCACCA CTTTGAGGTC 
ACTTTC C AGC AGTC CAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC GC TC TTGAAG 
AAACTCTACT GCCAGATCGC CAAGACATGC CCCATCCAGA TCAAGGTGTC CACCCCGCCA 
CCCCCAGGCA CTGCCATCCG GGCCATGCCT GTTTACAAGA AAGCGGAGCA CGTGACCGAC 



120 
180 



360 
420 



559 



60 
120 
160 
240 
300 
360 
420 
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GT C GT GAAAC 


GCTGCCCCAA 


CCACGAGCTC 


QGGAGGGACT 


TCAACGAAGG 


ACAGTCTGCT 


430 


CCAGCCAGCC 


ACCTCATCCG 


CGT GGAAGGC 


AATAATCTCT 


CGCAGTATGT 


GGATGACCCT 


540 


GTCACCGGCA 


GGCAGAGCGT 


CGTGGTGCCC 


TATGAGCCAC 


CACAGGTGGG 


GACGGAAT7C 


€00 


ACCACCATCC 


TGTACAACTT 


CATGTGTAAC 


AGCAGCTGTG 


TAGGGGGCAT 


GAACCGGCGG 


660 


CCCATCCTCA 


TCATCATCAC 


CCTGGAGATG 


CGGGATGGGC 


AGGTGCTGGG 


CCGCCGGTCC 


720 


TTTGAGGGCC 


GCATCTGCGC 


CTGTCCTGGC 


CGCGACCGAA 


AAGCTGATGA 


GGACCACTAC 


780 


CGGGAGCAGC 


AGGCCCTGAA 


CGAGAGCTCC 


GCCAAGAACG 


GGGCCGCCAG 


CAAGCGTGCC 


340 


T T C AAGCAGA 


GCCCCCCTGC 


CGTCCCCGCC 


CTTGGTGCCG 


GTGTGAAGAA 


GCGGCGGCAT 


900 


GG AG AC GAGG 


ACACGTACTA 


CCTTCAGGTG 


CGAGGCCGGG 


AGAAC TTTG A 


GATC CTGATG 


960 


AAGCTGAAAG 


AGAGCCTGGA 


GCTGATGGAG 


TTGGTGCCGC 


AGC C ACTGGT 


GGACTCCTAT 


1020 


CGGCAGCAGC 


AGCAGCTCCT 


AC AGAGGCC G 


AGTC AC CTAC 


AGCCCCCGTC 


CTACGGGCCG 


1080 


GTCCTCTCGC 


CCATGAACAA 


GGTGCACGGG 


GGCATGAACA 


AGCTGCCCTC 


CGTCAACCAG 


1140 


CTGGTGGGCC 


AGCCTCCCCC 


GCACAGTTCG 


GCAGCTACAC 


CCAACCTGGG 


GCCCGTGGGC 


1200 


CCCGGGATGC 


TCAACAACCA 


TGGCCACGCA 


GTGCCAGCCA 


AC GGC GAGAT 


GAGCAGCAGC 


1260 


CACAGCGCCC 


AGTC CATGGT 


CTCGGGGTCC 


CACTGCACTC 


CGCCACCCCC 


CTACCACGCC 


1320 


GACCCCAGCC 


TCGTCAGTTT 


TTTAACAGGA 


TTGGGGTGTC 


CAAACTGCAT 


CGAGTATTTC 


1380 


ACCTCCCAAG 


GGTTACAGAG 


CAT T T AC CAC 


CTGCAGAACC 


TGAC CAT TGA 




1 A A f\ 


GCCCTGAAGA 


TCCCCGAGCA 


GTACCGCATG 


ACCATCTGGC 


GGGGCCTGCA 


GGACCTGAAG 


:soo 


CAGGGCCACG 


ACTACAGCAC 


CGCGCAGCAG 


CTGCTCCGCT 


CTAGCAACGC 


GGCCACCATC 


1560 


TCCATCGGCG 


GCTCAGGGGA 


ACTGCAGCGC 


CAGCGGGTCA 


TGGAGGCCGT 


GCACTTCCGC 


1620 


GTGCGCCACA 


CCATCACCAT 


CCCCAACCGC 


GGCGGCCCAG 


GCGGCGGCCC 


TGAC GAGTGG 


1680 


GCGGACTTCG 


GCTTCGACCT 


GCCCGACTGC 


AAGGCCCGCA 


AGCAGCCCAT 


CAAGGAGGAG 


1740 


TTCACGGAGG 


CCGAGATCCA 


CTGA 








1764 


(2) INFORMATION POUR LA SEQ ID NO: 13: 









ti) CARACTERISTIQUBS DE IA SEQUENCE: 
(A> LONGUEUR: 587 acidea amines 
(B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: proteine 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

Met Leu Tyr Val Gly Asp Pro Ala Arg His Leu Ala Thr Ala Gin Phe 
15 10 is 

Aan Leu Leu Ser Ser Thr Mer Asp Gin Met Ser Ser Arg Ala Ala Ser 

20 25 30 

Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser 
35 40 45 

Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro 
SO 55 60 
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Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val 
65 70 75 80 

Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Ty- Ser 
85 90 95* 

Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro He 
100 105 no 

Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala 
115 120 125 

Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arq 
130 135 140 

Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala 
145 150 155 160 

Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin Tyr 
165 170 175 

Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 

Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe Met 
195 200 205 

Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu He 
210 215 220 

He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 240 

Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp 
245 2S0 255 

Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys 
260 265 210 

Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val 
275 280 285 

Pr ° ™« LeU Gly Al * Gly Val Lys Arg His Gly Asp Glu Asp 

290 295 300 

Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 320 

Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
325 330 335 

Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His 
340 345 350 

Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val 
355 3 6 o 365 

His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin 
370 375 300 

Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly 
385 390 395 400 

Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly Glu 
405 410 41 | 

Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His Cys 
420 42S 430 

445 



Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu 

H Ji 440 - - - 
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Thr Gly Leu Gly Cys Pro Asn Cys lie Glu Tyr Phe Thr Ser Gin Gly 
450 455 * 460 

Leu Gin Ser lie Tyr His Leu Gin Asn Leu Thr lie Glu Asp Leu Gly 
465 470 475 48 0 

Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu 
485 490 495 

Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu 
500 505 510 

Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu 
515 520 525 

Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr 
530 535 540 

He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp 
545 550 555 560 

Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro 
565 570 575 

He Lys Glu Glu Phe Thr Glu Ala Glu He His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1521 paires de bases 

(B) TYPE: acide nuclei que 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADNc 

<Vi) ORIGINS : 

(A) ORGANISMS: Homo sapiens 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

ATGCTGTACG TCGGTGACCC CGCACGGCAC CTCGCCACGG CCCAGTTCAA TCTGCTGAGC 60 

AGC AC CAT GG AC CAGAT GAG CAGCCGCGCG GCCTCGGCCA GCCCCTACAC CCCAGAGCAC 120 

GCCGCCAGCG TGCCCACCCA CTCGCCCTAC GCACAACCCA GCTCCACCTT C GACACCATG 160 

TCGCCGGCGC CTGTCATCCC CTCCAACACC GACTACCCCG GACCCCACCA CTTTGAGGTC 240 

ACTTTCCAGC AGTCCAGCAC GGCCAAGTCA GCCACCTGGA CGTACTCCCC GCTCTTGAAG 300 

AAACTCTACT GCCAGATCGC CAAGACATGC CCCATCCAGA TCAAGGTGTC CACCCCGCCA 360 

CCCCCAGGCA CTGCCATCCG GGCCATGCCT GTTTACAAGA AAGCGGAGCA CGTGACCGAC 420 

GTCGTGAAAC GCTGCCCCAA CCACGAGCTC GGGAGGGACT TCAACGAAGG ACAGTC TGCT 480 

CCAGCCAGCC ACCTCATCCG C5TGGAAGGC AATAATCTCT C GCAGTATGT GGATGACCCT 540 

GTCACCGGCA GGCAGAGCGT CGTGGTGCCC TATGAGC CAC CACAGGTGGG GACGGAATTC 600 

ACCACCATCC TGTACAACTT CATGTGTAAC AGCAGCTGTG TAGGGGGCAT GAACCGGCGG 660 

CCCATCCTCA T CAT CAT CAC CCTGGAGATG CGGGATGGGC AGGT GCTGGG CCGCCGGTCC 720 

TTTGAGGGCC GCATCTGCGC CTGTCCTGGC CGCGACCGAA AAGCTGATGA GGACCACTAC 780 

CGGGAGCAGC AGGCCCTGAA CGAGAGCTCC GCCAAGAACG GGGCCGCCAG CAAGCGTGCC 84 0 

TTCAAGCAGA GCCCCCCTGC CGTCCCCGCC CTTGGTGCCG GTGTGAAGAA GCGGCGGCAT 900 



WO 97/28186 



65 



PCT/FR97/00214 



1521 



GG AG AC GAGG AC AC GT AC T A CCTTCAGGTG CGAGGCC3GG AGAACTTTGA GATCCTGATG 960 

AAGCTGAAAG AGAGCCTGGA GCTGATGGAG TTGGTGCCGC AGCCACTGGT GGACTCCTAT 1020 

CGGCAGCAGC AGCAGCTCCT ACAGAGGCCG CCCCGGGATG CTCAACAACC ATGGCCACGC 1080 

AGTGCCAGCC AACGGCGAGA TGAGCAGCAG CCACAGCGCC CAGTCCATGG TCTCGGGGTC 1140 

CCACTGCACT CCGCCACCCC CCTACCACGC CGACCCCAGC CTCGTCAGGA CCTGGGGGCC 1200 

CTGAAGATCC CCGAGCAGTA CCGCATGACC ATCTGGCGGG GCCTGCAGGA CCTGAAGCAG 1260 

GGCCACGACT ACAGCACCGC GCAGCAGCTG CTCCGCTCTA GC AACGCGGC CACCATCTCC 1320 

ATCGGCGGCT CAGGGGAACT GCAGCGCCAG CGGGTCATGG AGGC C GTGC A CTTCCGCGTG 1380 

CGCCACACCA TCACCATCCC CAACCGCGGC GGCCCAGGCG GCGGCCCTGA CGAGTGGGCG 14 40 

GACTTCGGCT TCGACCTGCC CGACTGCAAG GCCCGCAAGC AGCCCATCAA GGAGGAGTTC 1500 
AC GG AGGC C G AGATCCACTG A 

(2) INFORMATION POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 506 acidea amines 

(B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xx) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

Met Leu Tyr Val Gly Aap Pro Ala Arg Hia Leu Ala Thr Ala Gin Phe 
15 10 is 

Asn Leu Leu Ser Ser Thr Met Aap Gin Met Ser Ser Arg Ala Ala Ser 
20 25 30 

Ala Ser Pro Tyr Thr Pro Glu Hia Ala Ala Ser Val Pro Thr Hia Ser 
35 40 45 

Pro Tyr Ala Gin Pro Ser Ser Thr Phe Aap Thr Met Ser Pro Ala Pro 
50 55 60 

Val lie Pro Ser Aan Thr Aap Tyr Pro Gly Pro Hia Hia Phe Glu Val 
65 7 ° 75 eo 

Thr Phe Gin Gin Ser Ser Thr Ala Lya Ser Ala Thr Trp Thr Tyr Ser 
85 90 95 

Pro Leu Leu Lya Lya Leu Tyr Cya Gin lie Ala Lya Thr Cys Pro lie 
100 105 no 

Gin He Lya Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala 
113 120 125 

Met Pro Val Tyr Lya Lya Ala Glu Hia Val Thr Aap Val Val Lya Arg 

Cya Pro Aan Hia Glu Leu Gly Arg Aap Phe Aan Glu Gly Gin Ser Ala 
145 150 155 160 

Pro Ala Ser Hia Leu He Arg Val Glu Gly Aan Aan Leu Ser Gin Tvr 
!65 170 175 

Val Aap Aap Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr Glu 
180 185 190 
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Pro Pro Gin Val Gly Thr Glu Pfce Thx Thr lie Leu Tyr Asn Phe Met 
195 200 205 

Cya Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu He 
210 215 220 

He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg Ser 
225 230 235 240 

Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp 
245 250 255 

Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys 
260 265 270 

Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val 
275 280 285 

Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu Asp 
290 295 300 

Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu Met 
305 310 315 320 

Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu 
32S 330 335 

Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Pro Arg 
340 345 350 

Asp Ala Gin Gin Pro Trp Pro Arg Ser Ala Ser Gin Arg Arg Asp Glu 
355 360 365 

Gin Gin Pro Gin Arg Pro Val His Gly Leu Gly Val Pro Leu His Ser 
370 375 360 

Ala Thr Pro Leu Pro Arg Arg Pro Gin Pro Arg Gin Asp Leu Gly Ala 
385 390 395 400 

Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly Leu Gin 
405 410 415 

Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg 
420 425 430 

Ser Ser Aan Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu Gin 
435 440 445 

Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His Thr He 
450 455 460 

Thr ll« Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu Trp Ala 
465 470 475 480 

Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin Pro He 
485 490 495 

Lys Glu Glu Phe Thr Glu Ala Glu He His 
500 505 

(2) INFORMATION POUR LA SEQ 10 NO: 16: 

(i) CARACTERISTIQUBS DE LA SEQUENCE: 

(A) LONGUEUR: 1870 paires de bases 

(B) TYPE: acide nucleique 
<C) N 0MB RE DE BR INS ; double 
<D) CONFIGURATION: lineaire 

<il) TYPE DE MOLECULE: ADNc 

(vi) ORIGINE: 

(A) ORGANISMS: Homo sapiens 
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<ixj CARACTERI5TIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 104.. 1867 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

TGCCCGGGGC TGCGACGGCT GCAGGGAACC AGAGAGC AC C TACTTCGACC TTCCCCAGTC 

AAGCCGGGGG AATAATGAGG TGGTGGGCGG AACGGATTCC AGC ATG GAC GTC TTC 

Met Asp Val Phe 
1 

CAC CTG GAG GGC ATG ACT ACA TCT GTC ATG GCC CAG TTC AAT CTG CTG 

His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin Phe Asn Leu Leu 

* 10 15 20 

AGC AGC ACC ATG GAC CAG ATG AGC AGC CGC GCG GCC TCG GCC AGC CCC 
Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala Ser Ala Ser Pro 
25 30 35 

TAC ACC CCA GAG CAC GCC GCC AGC GTG CCC ACC CAC TCG CCC TAC GCA 
Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His Ser Pro Tyr Ala 
40 45 50 

CAA CCC AGC TCC ACC TTC GAC ACC ATG TCG CCG GCG CCT GTC ATC CCC 
Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala Pro Val He Pro 
55 60 65 

TCC AAC ACC GAC TAC CCC GGA CCC CAC CAC TTT GAG GTC ACT TTC CAG 
Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu Val Thr Phe Gin 
70 75 80 

CAG TCC AGC ACG GCC AAG TCA GCC ACC TGG ACG TAC TCC CCG CTC TTG 
Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr Ser Pro Leu Leu 
8S 90 95 ioo 

AAG AAA CTC TAC TGC CAG ATC GCC AAG ACA TGC CCC ATC CAG ATC AAG 
Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro He Gin He Lys 
105 no u 5 

GTG TCC ACC CCG CCA CCC CCA GGC ACT GCC ATC CGG GCC ATG CCT GTT 
val ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg Ala Met Pro Val 
120 125 130 

TAC AAG AAA GCG GAG CAC GTG ACC GAC GTC GTG AAA CGC TGC CCC AAC 
Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys Arg Cys Pro Asn 
135 140 145 

^ tI C ??* ^ TTC AAC GAA GGA CAG TCT GCT CCA GCC AGC 

His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser Ala Pro Ala Ser 

155 i6o 

His llu zll *™ S T ? 5^ AAT AAT CTC TCG CAG TAT GTG GAT GAC 

165 9 i" ly A5n L * U Ser Gln T * r Vai Asp Asp 

170 175 180 

CCT GTC ACC GGC AGG CAG AGC GTC GTG GTG CCC TAT GAG CCA CCA CAG 
Pro Val Thr Gly Arg Gin Ser Val Val Val Pro ?yr gTu Prt Pr^ £n 
165 190 



195 



vlf £k G Sf* TTC ACC ACC ATC CTG TAC AAC TTC ATG TGT AAC AGC 

Val Gly Thr Glu Phe Thr Thr lie Leu Tyr Asn Phe Met Cys Asn Ser 
200 205 210 

IT* vll £5 tit T C CCC ATC m ATC ATC ATC ACC 

Cy3 ;?J Gly Glv Met Asn Arg Arg Pro He Leu He He He Thr 
215 220 225 

1 1?. ^ t T ° CGG GAT GGG CAG GTG CTG GGC CGC CGG TCC TTT GAG GGC 
Leu Glu Met Arg Asp Gly Gin Val Leu Gly Axg Arg Ser III £u Gly 



60 
115 



163 



211 



259 



307 



355 



403 



451 



499 



547 



595 



643 



691 



739 



767 



835 
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230 235 240 

CGC ATC TGC GCC TGT CCT GGC CGC GAC CGA AAA GCT GAT GAG GAC CAC 883 
Arg lie Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala Asp Glu Asp His 
245 250 255 260 

TAC CGG GAG CAG CAG GCC CTG AAC GAG AGC TCC GCC AAG AAC GGG GCC 931 
Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala Lys Asn Gly Ala 
265 270 275 

GCC AGC AAG CGT GCC TTC AAG CAG AGC CCC CCT GCC GTC CCC GCC CTT 979 
Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala Val' Pro Ala Leu 
280 285 290 

GGT GCC GGT GTG AAG AAG CGG CGG CAT GGA GAC GAG GAC ACG TAC TAC 1027 
Gly Ala Gly Val Lys Lys Axg Arg His Gly Asp Glu Asp Thr Tyr Tyr 
295 300 30S 

CTT CAG GTG CGA GGC CGG GAG AAC TTT GAG ATC CTG ATG AAG CTG AAA 1075 
Leu Gin Val Arg Gly Arg Glu Asn Phe Glu lie Leu Met Lys Leu Lys 
310 315 320 

GAG AGC CTG GAG CTG ATG GAG TTG GTG CCG CAG CCA CTG GTG GAC TCC 1123 
Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro Leu Val Asp Ser 
325 330 335 340 

TAT CGG CAG CAG CAG CAG CTC CTA CAG AGG CCG AGT CAC CTA CAG CCC 1171 
Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser His Leu Gin Pro 
345 350 355 

CCG TCC TAC GGG CCG GTC CTC TCG CCC ATG AAC AAG GTG CAC GGG GGC 1219 
Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys Val His Gly Gly 
360 365 370 

ATG AAC AAG CTG CCC TCC GTC AAC CAG CTG GTG GGC CAG CCT CCC CCG 1267 
Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly Gin Pro Pro Pro 
375 380 385 

CAC AGT TCG GCA GCT ACA CCC AAC CTG GGG CCC GTG GGC CCC GGG ATG 1315 
His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val Gly Pro Gly Met 
390 395 400 

CTC AAC AAC CAT GGC CAC GCA GTG CCA GCC AAC GGC GAG ATG AGC AGC 1363 
Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly Glu Met Ser Ser 
405 410 415 420 

AGC CAC AGC GCC CAG TCC ATG GTC TCG GGG TCC CAC TGC ACT CCG CCA 1411 
Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His Cys Thr Pro Pro 
425 430 435 

CCC CCC TAC CAC GCC GAC CCC AGC CTC GTC AGT TTT TTA ACA GGA TTG 1459 
Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe Leu Thr Gly Leu 
440 445 450 

GGG TGT CCA AAC TGC ATC GAG TAT TTC ACC TCC CAA GGG TTA CAG AGC 1507 
Gly Cys Pro Asn Cys Il« Glu Tyr Phe Thr Ser Gin Gly Leu Gin Ser 
455 460 465 

ATT TAC CAC CTG CAG AAC CTG ACC ATT GAG GAC CTG GGG GCC CTG AAG 1555 
lie Tyr His Leu Gin Aan Leu Thr lie Glu Asp Leu Gly Ala Leu Lys 
470 475 480 

ATC CCC GAG CAG TAC CGC ATG ACC ATC TGG CGG GGC CTG CAG GAC CTG 1603 
He Pro Glu Gin Tyr Arg Met Thr lie Trp Arg Gly Leu Gin Asp Leu 
485 490 495 500 

AAG CAG GGC CAC GAC TAC AGC ACC GCG CAG CAG CTG CTC CGC TCT AGC 1651 
Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu Leu Arg Ser Ser 
S05 510 515 

AAC GCG GCC ACC ATC TCC ATC GGC GGC TCA GGG GAA CTG CAG CGC CAG 1699 
Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu Leu Gin Arg Gin 
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520 

CGG GTC ATG GAG GCC GTG 
Arg Val Met Glu Ala Val 
535 

CCC AAC CGC GGC GGC CCA 
Pro Asn Arg Gly Gly Pro 

550 

GGC TTC GAC CTG CCC GAC 
Gly Phe Asp Leu Pro Asp 
565 570 

GAG TTC ACG GAG GCC GAG 
Glu Phe Thr Glu Ala Glu 
585 



S25 

CAC TTC CGC GTG CGC CAC 
His Phe Arg Val Arg His 
540 

GGC GGC GGC CCT GAC GAG 
Gly Gly Gly Pro Asp Glu 
555 560 

TGC AAG GCC CGC AAG CAG 
Cys Lys Ala Arg Lys Gin 
575 

ATC CAC TGA 
lie His 



530 

ACC ATC ACC ATC 1747 

Thr He Thr He 

545 

TGG GCG GAC TTC 1795 
Trp Ala Asp Phe 



CCC ATC AAG GAG 1843 
Pro He Lys Glu 
580 

1870 



(2) INFORMATION POUR LA SEQ ID NO: 17: 

(i) CARACTERI5TIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 588 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(il) TYPE DE MOLECULE: proteine 

<xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
15 10 15 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 

20 25 30 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
35 40 45 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
b0 5S 6 o 

Pro val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
65 70 75 80 

val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
85 90 9 5 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin He Ala Lys Thr Cys Pro 

100 105 no 

He Gin lie Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
Aia 120 125 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys 



140 



Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Gin Ser 
150 155 160 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
165 170 175 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
180 185 190 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
A5f3 200 205 

Met cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Axg Pro lie Leu 



220 
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Tie He lie Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Arg 
225 230 235 240 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
245 2S0 255 

Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
2S0 265 270 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
27S 290 28S 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
290 295 300 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
305 310 315 320 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
325 330 335 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
340 345 350 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
355 360 365 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
370 375 380 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Asn Leu Gly Pro Val 
385 390 395 400 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
405 410 415 

Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
420 425 430 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Ser Phe 
435 440 445 

Leu Thr Gly Leu Gly Cys Pro Asn Cys He Glu Tyr Phe Thr Ser Gin 
4S0 45S 460 

Gly Leu Gin Ser He Tyr His Leu Gin Asn Leu Thr He Glu Asp Leu 
465 470 475 490 

Gly Ala Leu Lys He Pro Glu Gin Tyr Arg Met Thr He Trp Arg Gly 
435 490 495 

Leu Gin Asp Leu Lys Gin Gly His Asp Tyr Ser Thr Ala Gin Gin Leu 
500 505 510 

Leu Arg Ser Ser Asn Ala Ala Thr He Ser He Gly Gly Ser Gly Glu 
515 520 525 

Leu Gin Arg Gin Arg Val Met Glu Ala Val His Phe Arg Val Arg His 
530 535 540 

Thr He Thr He Pro Asn Arg Gly Gly Pro Gly Gly Gly Pro Asp Glu 
545 550 5S5 560 

Trp Ala Asp Phe Gly Phe Asp Leu Pro Asp Cys Lys Ala Arg Lys Gin 
565 570 575 

Pro He Lys Glu Glu Phe Thr Glu Ala Glu He His 
580 585 

(2) INFORMATION POUR LA SEQ ID NO: 18: 

ti) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: 1817 pairejs de bases 
<B> TYPE: acide nucleique 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION : lineaire 

< ii) TYPE DE MOLECULE: ACNc 

tvi) ORIGINE: 

(A) ORGANI5ME: Homo sapiens 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

ATGGCCCAGT CCACCGCCAC CTCCCCTGAT GGGGGCACCA CGTTTGAGCA CCTCTGGAGC 60 

TCTCTGGAAC CAGACAGCAC CTACTTCGAC CTTCCCCAGT CAAGCCGGGG GAAT AAT GAG 120 

GTGGTGGGCG GAAC GGATTC CAGCATGGAC GTCTTCCACC TGGAGGGCAT GACTACATCT 180 

GTCATGGCCC AGTTCAATCT GCT GAGC AGO ACCATGGACC AGATGAGCAG CCGCGCGGCC 2 40 

TCGGCCAGCC CCTACACCCC AGAGCACGCC GCCAGCGTGC CCACCCACTC GCCCTACGCA 300 

CAACCCAGCT CCACCTTCGA CACCATGTCG CCGGCGCCTG TCATCCCCTC CAACACCGAC 3 60 

TACCCCGGAC CCCACCACTT TGAGGTCACT TTCCAGCAGT CCAGCACGGC CAAGTCAGCC 420 

ACCTGGACGT ACTCCCCGCT CTTGAAGAAA CTCTACTGCC AGATCGCCAA GACATGCCCC 460 

AT C C AGATCA AGGTGTC C AC CCCGCCACCC C C AGGCACTG CCATCCGGGC CATGCCTGTT 540 

TACAAGAAAG CGGAGCACGT GACCGACGTC GTGAAACGCT GCCCCAACCA CGAGCTCGGG 600 

AGGGACTTCA ACGAAGGAC A GTCTGCTCCA GCCAGCCACC TCATCCGCGT GGAAGGCAAT 660 

AATCTCTCGC AGTAT GT GGA TGACCCTGTC ACCGGCAGGC AGAGCGTCGT GGTGCCCTAT 720 

GAGCCACCAC ACGTGGGGAC GGAATTCACC ACCATCCTGT ACAACTTCAT GTGTAACAGC 780 

AGCTGTGTAG GGGGCATGAA CCGGCGGCCC ATCCTCATCA TCATCACCCT GGAGATGCGG 840 

GATGGGCAGG TGCTGGGCCG CCGGTCCTTT GAGGGCCGCA TCTGCGCCTG TCCTGGCCGC 900 

G AC C GAAAAG CTGATGAGGA CCACTACCGG GAGCAGCAGG CCCTGAACGA GAGCTCCGCC 960 

AAGAACGGGG CCGCCAGCAA GCGTGCCTTC AAGCAGAGCC CCCCTGCCGT CCCCGCCCTT 1020 

GGTGCCGGTG TGAAGAAGCG GCCGCATGGA GACGAGGACA CGTACTACCT T CAGGTGC GA 1080 

GGCCGGGAGA ACTTTGAGAT CCTGATGAAG CTGAAAGAGA GCCTGGAGCT GATGGAGTTG 1140 

GTGC C GCAGC CACTGGTGGA CTCCTATCGG CAGCAGCAGC AGCTCCTACA GAGGCCGAGT 1200 

CACCTACAGC CCCCGTCCTA CGGGCCGGTC CTCTCGCCCA TGAACAAGGT GCACGGGGGC 12 60 

ATGAACAAGC TGCCCTCCGT CAACCAGCTG GTGGGCCAGC CTCCCCCGCA CAGTTCGGCA 1320 

GCTACACCCA ACCTGGGGCC CGTGGGCCCC GGGATGCTCA ACAAC CAT GG CCACGCAGTG 1380 

CCAGCCAACG GCGAGATGAG CAGCAGCCAC AGCGCCCAGT CCATGGTCTC GGGGTC CCAC 144 0 

TGCACTCCGC CACCCCCCTA CCACGCCGAC CCCAGCCTCG TCAGGACCTG GGGGCCCTGA 1500 

AGATCCCCGA GCAGTACCGC ATGACCATCT GGCGGGGCCT GCAGGACCTG AAGCAGGGCC 1560 

ACGAC TACAG CACCGCGCAG CAGCTGCTCC GCTCTAGCAA CGCGGCCACC ATCTCCATCG 1620 

GCGGCTCAGG GGAACTGCAG CGCCAGCGGG TCATGGAGGC CGTGCACTTC CGCGTGCGCC 1680 

ACACCATCAC CATCCCCAAC CGCGGCGGCC CAGGCGGCGG CCCTGACGAG TGGGCGGACT 1740 

TCGGCTTCGA CCTGCCCGAC TGCAAGGCCC GCAAGCAGCC CATCAAGGAG GAGTTCACGG 1800 
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AGGCCGAGAT CCACTGA 

12) INFORMATION POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 499 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

Met Ala Gin Ser Thr Ala Thr Ser Pro Asp Gly Gly Thr Thr Phe Glu 
15 10 15 

His Leu Trp Sec Ser Leu Glu Pro Asp Ser Thr Tyr Phe Asp Leu Pro 
20 2S 30 

Gin Ser Ser Arg Gly Asn Asn Glu Val Val Gly Gly Thr Asp Ser Ser 
35 40 45 

Met Asp Val Phe His Leu Glu Gly Met Thr Thr Ser Val Met Ala Gin 
50 55 60 

Phe Asn Leu Leu Ser Ser Thr Met Asp Gin Met Ser Ser Arg Ala Ala 
65 70 75 80 

Ser Ala Ser Pro Tyr Thr Pro Glu His Ala Ala Ser Val Pro Thr His 
85 90 95 

Ser Pro Tyr Ala Gin Pro Ser Ser Thr Phe Asp Thr Met Ser Pro Ala 
100 105 HO 

Pro Val lie Pro Ser Asn Thr Asp Tyr Pro Gly Pro His His Phe Glu 
US 120 125 

Val Thr Phe Gin Gin Ser Ser Thr Ala Lys Ser Ala Thr Trp Thr Tyr 
130 135 140 

Ser Pro Leu Leu Lys Lys Leu Tyr Cys Gin lie Ala Lys Thr Cys Pro 
145 150 155 160 

lie Gin He Lys Val Ser Thr Pro Pro Pro Pro Gly Thr Ala He Arg 
165 170 175 

Ala Met Pro Val Tyr Lys Lys Ala Glu His Val Thr Asp Val Val Lys 
180 18S 190 

Arg Cys Pro Asn His Glu Leu Gly Arg Asp Phe Asn Glu Gly Glri Ser 
195 200 205 

Ala Pro Ala Ser His Leu He Arg Val Glu Gly Asn Asn Leu Ser Gin 
210 215 220 

Tyr Val Asp Asp Pro Val Thr Gly Arg Gin Ser Val Val Val Pro Tyr 
225 230 235 240 

Glu Pro Pro Gin Val Gly Thr Glu Phe Thr Thr He Leu Tyr Asn Phe 
245 250 255 

Met Cys Asn Ser Ser Cys Val Gly Gly Met Asn Arg Arg Pro He Leu 
260 265 270 

He He He Thr Leu Glu Met Arg Asp Gly Gin Val Leu Gly Arg Ara 
275 280 285 

Ser Phe Glu Gly Arg He Cys Ala Cys Pro Gly Arg Asp Arg Lys Ala 
290 295 300 
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Asp Glu Asp His Tyr Arg Glu Gin Gin Ala Leu Asn Glu Ser Ser Ala 
305 310 " 315 320 

Lys Asn Gly Ala Ala Ser Lys Arg Ala Phe Lys Gin Ser Pro Pro Ala 
325 330 335 

Val Pro Ala Leu Gly Ala Gly Val Lys Lys Arg Arg His Gly Asp Glu 
340 345 350 

Asp Thr Tyr Tyr Leu Gin Val Arg Gly Arg Glu Asn Phe Glu He Leu 
355 360 365 

Met Lys Leu Lys Glu Ser Leu Glu Leu Met Glu Leu Val Pro Gin Pro 
370 375 380 

Leu Val Asp Ser Tyr Arg Gin Gin Gin Gin Leu Leu Gin Arg Pro Ser 
385 390 395 400 

His Leu Gin Pro Pro Ser Tyr Gly Pro Val Leu Ser Pro Met Asn Lys 
405 410 415 

Val His Gly Gly Met Asn Lys Leu Pro Ser Val Asn Gin Leu Val Gly 
420 425 430 

Gin Pro Pro Pro His Ser Ser Ala Ala Thr Pro Aan Leu Gly Pro Val 
435 440 445 

Gly Pro Gly Met Leu Asn Asn His Gly His Ala Val Pro Ala Asn Gly 
450 455 460 

Glu Met Ser Ser Ser His Ser Ala Gin Ser Met Val Ser Gly Ser His 
465 470 475 480 

Cys Thr Pro Pro Pro Pro Tyr His Ala Asp Pro Ser Leu Val Arg Thr 
485 490 495 

Trp Gly Pro 



(2) INFORMATION POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
<D) CONFIGURATION: lineaxre 

(ii) TYPE DE MOLECULE: ADN 

(iii) HYPOTHETIQUE: NOW 

(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE IA SEQUENCE: SEQ ID NO: 20: 
GCGAGCTGCC CTCGGAG 

(2) INFORMATION POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: OUI 
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(Xi) DESCRIPTION DC LA SEQUENCE: SEQ ID NO: 21: 
GGTTCTGCAG GTGACTCAG 

(2) INFORMATION POUR LA SEQ ID NO: 22: 

(ii CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: IB paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 22: 
GCCATGCCTG TCTACAAG 

(2) INFORMATION POUR LA SEQ ID NO: 23: 

tl) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

( B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 23: 
AC C AGC T GGT TGACGGAG 

(2) INFORMATION POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANT I -SENS : NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24: 
GTCAACCAGC TGGTGGGCCA G 
(2) INFORMATION POUR LA SEQ ID NO: 25: 

(i) CARACTERISTIQUES DE IA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: OUI 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 25: 
GTGGATCTCG GCCTCC 

(2) INFORMATION POUR LA SEQ ID NO: 26: 

U> CARACTERI5TIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: acide nucleique 
<C) NO MB RE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

iii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 26: 
AGGCCGGCGT GGGGAAG 

(2) INFORMATION POUR LA SEQ ID NO: 27: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
(D> CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: OUI 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 27: - 
CTTGGCGATC TGGCAGTAG 

(2) INFORMATION POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 17 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii> TYPE DE MOLECULE: ADN 
fiii) ANTI-SENS: NON 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 28: 
GCGGCCACGA CCGTGAC 

(2) INFORMATION POUR LA SEQ ID NO: 29: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: acide nucl6ique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE; ADN 



(iii) ANTI-SENS: OUI 
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<xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 29: 
GGCAGCTTGG GTCTCTGG 18 
(2) INFORMATION PCUR LA SEQ ID NO: 30: 

<l) CAPACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

( B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(il) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 30: 
CTGTACGTCG GTGACCCC 18 
(2) INFORMATION POUR LA SEQ ID NO: 31: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nuclei que 
<C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE IA SEQUENCE: SEQ ID NO: 31: 

TCAGTGGATC TCGGCCTC 18 

<2) INFORMATION POUR LA SEQ ID NO: 32: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 18 paires de bases 
<B) TYPE: acide nuclei que 
(C) NOMBRE DE BRINS : simple 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : ADN 

(iii) ANTI-SENS: NON 



<xi) DESCRIPTION DE IA SEQUENCE; SEQ ID NO: 32: 
AGGGGACGCA GCGAAACC 18 
(2) INFORMATION POUR IA SEQ ID NO: 33: 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 
<D> CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: OUI 
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(xi) DESCRIPTION DE LA SEQUENCE: SEC I D NO : 33: 
CCATCAGCTC CAGGCTCTC 

(2) INFORMATION POUR LA SEQ ID NO: 34: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii> TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 34: 
CCAGGACAGG CGCAGATG 

(2) INFORMATION POUR LA SEQ ID NO: 35: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 
<A> LONGUEUR: 19 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

<ii> TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 35: 
GATGAGGTGG CTGGCTGGA 

(2) INFORMATION POUK LA SEQ ID NO: 36: 

(i> CARACTERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 19 paires de bases 
<B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANT I -SENS : OUI 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 36: 
TGGTCAGGTT CTCCAGGTG 

(2) INFORMATION POUR LA SEQ ID NO: 37: 

U) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(iii) ANTI-SENS: NON 
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(XI) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 37: 
CACCTACTCC AGGGATGC 18 
(2) INFORMATION POUR LA SEQ ID NO: 38: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

( B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iix) ANTI-SENS: OUI 



(XX) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 38: 
AGGAAAATAG AAGCGTCAGT C 21 
(2) INFORMATION POUR LA SEQ ID NO; 39: 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: acide nuclei que 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) ANTI-SENS: NON 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 39: . 
CAGGCCCACT TGCCTGCC 18 
(2) INFORMATION POUR LA SEQ ID NO: 40: 

(D CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: acide nuclei que 
CO NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(iii) ANTI-SENS: OUI 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 40: 
CTGTCCCCAA GCTGATGAG 
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REVENDICATIONS 

1. Polypeptide purifie, comprenant une sequence d'acides amines choisie parmi : 

a) la sequence SEQ ID n° 2 ; 

b) la sequence SEQ ID n° 4 ; 

c) la sequence SEQ ID n° 6 ; 

d) la sequence SEQ ID n° 8 ; 

e) la sequence SEQ ID n° 10 ; 

f) la sequence SEQ ID n°13 ; 

g) la sequence SEQ ID n° 15 ; 

h) la sequence SEQ ID n° 17 ; 

i) la sequence SEQ ID n° 19 ; 

et j) toute sequence biologiquement active d6riv£e de SEQ ID n° 2. SEQ ID n° 4, 
SEQ ID n° 6. SEQ ID n° 8, SEQ ID n° 10, SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 
ou SEQ ID n" 19. 

2. Polypeptide selon la revendication 1 ( caracterise en ce qu'il comprend la sequence 
d'acides amines choisie parmi SEQ ID n° 6, SEQ ID n° 13, SEQ ID n ft 15, SEQ ID 
n°17etSEQIDn°19. 

3. Polypeptide selon la revendication 1, caracteris6 en ce qu'il comprend la sequence 
comprise entre : 

- le rtsidu 1 10 et le rdsidu 310 de SEQ ID n° 2 ou 6 ; 

- Je rSsidu 60 et le residu 260 de SEQ ID n° 8. 

4. Polypeptide selon la revendication 1, caracterise en ce qu'il resulte d'un epissage 
aitematif de TARN messager du gdne correspondent. 

5. Polypeptide selon Tune quelconque des revendications precedentes, caracterise 
en ce qu'il s'agit d'un polypeptide recombinant produit sous la forme d'une proteine 
de fusion. 

6. Sequence d'acides nucteiques isotee codant pour un polypeptide selon I'une 
quelconque des revendications pr£c6dentes. 
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7. Sequence d'acides nudeiques isolee selon la revendication 6, caracterisee en ce 
qu'etle est choisie parmi : 

a) la sequence SEQ ID n° 1 ; 

b) la sequence SEQ ID n° 3 ; 
5 c) la sequence SEQ ID n° 5 ; 

d) la sequence SEQ ID n°7 ; 

e) la sequence SEQ ID n°9 ; 

f ) la sequence SEQ ID n° 11 ; 

g) la sequence SEQ ID n° 12 ; 
10 h) la sequence SEQ ID n° 14 ; 

i) la sequence SEQ ID n° 16 ; 
j) la sequence SEQ ID n° 18 ; 

k) les sequences d'acides nudeiques capabies de s'hybrider specifiquement £ la 
sequence SEQ ID n° 1, SEQ ID n° 3, SEQ ID n° 5, SEQ ID n°7, SEQ ID n°9, SEQ 
ID n° 11, SEQ ID n°12, SEQ ID n° 14, SEQ ID n* 16 ou SEQ ID n° 18 ou a leurs 
sequences complementaires, ou de s'hybrider specifiquement & leurs sequences 
proxirnales.; 

et I) les sequences derivees des sequences a), b) t c), d), e), f). 9). h). i), j) ou k) du 
fait de la degenerescence du code genetique, de mutation, de deletion, d'insertion, 
d'un epissage altematif ou d'une variability a lie li que. 



15 



20 



8. Sequence nucfeotidique selon la revendication 6, caracterisee en ce qu'il s'agit 
d'une sequence choisie parmi SEQ ID n° 5, SEQ ID n° 12 r SEQ ID n° 14, SEQ ID 
n° 16 et SEQ ID n° 18 codant respectivement pour le polypeptide de sequences 

25 SEQ ID n° 6, SEQ ID n° 13, SEQ ID n° 15, SEQ ID n° 17 et SEQ ID n° 19. 

9. Vecteur de donage et/ou d'expression contenant une sequence d'addes 
nudeiques selon Tune quelconque des revendications 6 d 8. 

30 10. Vecteur selon la revendication 9, caracterise en ce qu'il s'agit du plasmide pSE1 . 

11. Cellule hdte transfectee parun vecteur selon la revendication 9 ou 10. 



35 



12. Cellule h&te transfectee selon la revendication 11, caracterisee en ce qu'il s'agit 
de E. co// MC 1061. 
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13. Sonde nucleotidique ou amorce nucleotidique caracterisee en ce qu'elle shybride 
specifiquement avec Tune quelconque des sequences selon les revendications 6 
a 8 ou leurs sequences comp!6mentaires ou les ARN messagers correspondants 
ou les genes correspondants. 

14. Sonde ou amorce selon la revendication 13, caracterisee en ce qu'elle comporte 
au moins 16 nucleotides. 



15. Sonde ou amorce selon la revendication 13, caracterisee en ce qu'elle comprend 
I'integralite de la sequence du gdne codant pour Tun des polypeptides de la 
revendication 1. 



16. Sonde ou amorce nucleotidique choisie panmi les oligonucleotides suivants ou 
leurs compldmentaires : 

SEQ ID n° 20 : GCG AGC TGC CCT CGG AG 
SEQ ID n* 21 : GGT TCT GCA GGT GAC TCA G 
SEQ ID n° 22 : GCC ATG CCT GTC TAC AAG 
SEQ ID n° 23 : ACC AGC TGG TTG ACG GAG 
SEQ ID n° 24 : GTC AAC CAG CTG GTG GGC CAG 
SEQ ID n° 25 : GTG GAT CTC GGC CTC C 
SEQ ID n° 26 : AGG CCG GCG TGG GGA AG 
SEQ ID n° 27 : CTT GGC GAT CTG GCA GTA G 
SEQ ID n° 28 : GCG GCC ACG ACC GTG AC 
SEQ ID n a 29 : GGC AGC TTG GGT CTC TGG 
SEQ ID n* 30 : CTG TAC GTC GGT GAC CCC 
SEQ ID n* 31 : TCA GTG GAT CTC GGC CTC 
SEQ ID n° 32 : AGG GGA CGC AGC GAA ACC 
SEQ ID n° 33 : CCA TCA GCT CCA GGC TCT C 
SEQ ID n° 34 : CCA GGA CAG GCG CAG ATG 
SEQ ID n° 35 : GAT GAG GTG GCT GGC TGG A 
SEQ ID n° 36 : TGG TCA GGT TCT GCA GGT G 
SEQ ID n° 37 : CAC CTA CTC CAG GGA TGC 
SEQ ID n° 38 : AGG AAA ATA GAA GCG TCA GTC 
SEQ ID n° 39 : CAG GCC CAC TTG CCT GCC 
et SEQ ID n° 40 : CTG TCC CCA AGC TGA TGA G 
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17. Utilisation d'une sequence selon I'une quelconque des revendications 6 a 8 pour 
la fabrication d'amorces oligonucleotidiques pour des reactions de sequen<;age 
ou d'amplification specifique selon la technique de PCR ou toute variante de 
celle-ci. 

18. Couple d'amorces nucleotidiques, caracterise en ce qu'il comprend les amorces 
choisies parmi les sequences suivantes : 

a) amorce sens : GCG AGC TGC CCT CGG AG (SEQ ID n° 20) 
amorce antisens : GGT TCT GCA GGT GAC TCA G (SEQ ID n° 21) 

b) amorce sens : GCC ATG CCT GTC TAC AAG (SEQ ID n°22) 
amorce antisens : ACC AGC TGG TTG ACG GAG (SEQ ID n° 23) 

c) amorce sens : GTC AAC CAG CTG GTG GGC CAG (SEQ ID n° 24) 
amorce antisens : GTG GAT CTC GGC CTC C (SEQ ID n° 25) 

d) amorce sens : AGG CCG GCG TGG GGA AG (SEQ ID n° 26) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

e) amorce sens : GCG GCC ACG ACC GTG A (SEQ ID n° 28) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n°29) 

f) amorce sens : CTG TAC GTC GGT GAC CCC (SEQ ID n°30) 
amorce antisens : TCA GTG GAT CTC GGC CTC (SEQ ID n° 31) 

g) amorce sens : AGG GGA CGC AGC GAA ACC (SEQ ID n° 32) 
amorce antisens : GGC AGC TTG GGT CTC TGG (SEQ ID n° 29) 

h) amorce sens rCCCCCCCCCCCCCCN (ou N est egal £ G, A ou T) 
amorce antisens : CCA TCA GCT CCA GGC TCT C (SEQ ID n Q 33) 

i) amorce sens :CCCCCCCCCCCCCCN (ou N est egal £ G, A ou T) 
amorce antisens : CCA GGA CAG GCG CAG ATG (SEQ ID n° 34) 
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j) amorce sens : CCCCCCCCCCCCCCCN (ou N est egal a G, A ou T) 
amorce antisens : CTT GGC GAT CTG GCA GTA G (SEQ ID n° 27) 

k) amorce sens : CAC CTA CTC CAG GGA TGC (SEQ ID n° 37) 

amorce antisens : AGG AAA ATA GAA GCG TCA GTC (SEQ ID n° 38) 

et I) amorce sens :CAG GCC CAC TTG CCT GCC (SEQ ID n° 39) 

amorce antisens : CTG TCC CCA AGC TGA TGA G (SEQ ID n° 40). 



19. Utilisation d'une sequence selon Tune quetconque des revendications 6 a 8, 
utilisable en therapie genique. 

20. Utilisation d'une sequence selon Tune quelconque des revendications 6 d 8 ( pour 
la realisation de sondes ou d'amorces nucfeotidiques de diagnostic, ou de 
sequences antisens utilisables en therapie genique. 

21. Utilisation d'amorces nucfeotidiques selon Tune quelconque des revendications 6 
£ 8 pour te s6quen$age. 

22. Utilisation d'une sonde ou amorce seton Tune quelconque des revendications 13 
a 16, comma outil de diagnostic in vitro pour la detection, par des experiences 
d'hybridation, des sequences d'acides nucteiques codant pour un polypeptide 
selon Tune quelconque des revendications 13 4, dans des echantillons biologi- 
ques, ou pour la mise en evidence de syntheses aberrantes ou d'anomalies 
g6n6tiques. 

23. Methode de diagnostic in vitro pour la detection de synthases aberrantes ou 
d'anomalies genetiques au niveau des sequences d'acides nucleiques codant 
pour un polypeptide selon Tune quelconque des revendications 1 a 4, 
caracteris^e en ce qu'elle comprend : 

• la mise en contact d'une sonde nucieotidique selon Tune quelconque des 
revendications 13 £ 16 avec un echantillon bioiogique dans des conditions 
permettant la formation d'un complexe d'hybridation entre ladite sonde et la 
susdite sequence nucieotidique, eventuellement apres une etape prealable 
^amplification de la susdite sequence nucieotidique ; 
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- la detection du complexe d'hybridation eventuellement forme ; 

- eventuellement le s§quen$age de la sequence nucieotidique formant le 
complexe d'hybridation avec la sonde de Pinvention. 

24. Utilisation d'une sequence d'acides nucl6iques selon I'une quelconque des 
revendications 6 a 8, pour la production d'un polypeptide recombinant selon Tune 
quelconque des revendications 1 £ 5. 

25. Methode de production d'une proteine recombinante SR-p70. caractdrisee en ce 
que Ton cultive des cellules transfecttes selon la revendication 10 ou 11 dans 
des conditions permettant Pexpression d'un polypeptide recombinant de 
sequence SEQ ID n° 2, SEQ ID n° 4, SEQ ID n°6, SEQ ID n° 8, SEQ ID n° 10, 
SEQ ID n°13, SEQ ID n° 15, SEQ ID n° 17 ou SEQ ID n° 19 ou tout fragment ou 
derive biologiquement actif, et que Ton recupfcre ledit polypeptide recombinant. 

26. Anticorps mono ou polyclonaux ou leurs fragments, anticorps chimeriques ou 
immunoconjugu§s, caract6ris£s en ce qu'ils sont capables de reconnaitre specifi- 
quement un polypeptide selon Tune quelconque des revendications 1 a 4. 

27. Utilisation des anticorps selon la revendication precedente, pour la purification ou 
la detection d'un polypeptide selon Tune quelconque des revendications 1 a 4 
dans un dchantillon biologique. 

28. Proc6dd de diagnostic in vitro de pathologies corrdlees a une expression ou une 
accumulation anormale de proteines SR-p70, notamment les phenom^nes de 
canc6risation, d partir d'un pr6!6vement biologique, caracteris6 en ce que I'on 
met en contact au moins un anticorps selon la revendication 25 avec ledit 
prdldvement biologique, dans des conditions permettant la formation 6ventuelle 
de complexes immunologiques sp6tifiques entre une protdine SR-p70 et le ou 
lesdits anticorps et en ce que Ton ddtecte les complexes immunologiques specify 
ques Eventuellement formes. 

29. Kit pour le diagnostic in vitro d'une expression ou une accumulation anormale de 
prot6ines SR-p70 dans un prStevement biologique et/ou pour la mesure du taux 
depression de celles-ci dans ledit prtldvement comprenant : 
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- au moins un anticorps selon la revendication 25, eventueliement fixe sur un 
support, 

- des moyens de revelation de la formation de complexes antigenes/anticorps 
specifiques entre une proteins SR-p70 et ledit anticorps et/ou des moyens de 
quantification de ces complexes. 

30. Methode pour le diagnostic precoce de la formation des tumeurs caracterisee en 
ce que I'on met en evidence dans un echantillon de serum preiev6 chez un 
individu des auto-anticorps dirig6s contre une proteine SR-p70 selon les etapes 
consistant a mettre en contact un echantillon de serum preleve chez un individu 
avec un polypeptide de I'invention, eventueliement fixe sur un support, dans des 
conditions permettant la formation de complexes immunologiques specifiques 
entre ledit polypeptide et les auto-anticorps eventueliement presents dans 
Techantillon de serum, et en ce que Ton detecte les complexes immunologiques 
specifiques Eventueliement formes. 

31. Methode de determination d'une variability antique, d'une mutation, d'une 
delation, d'une insertion, d'une perte d'heterozygotie ou d'une anomalie 
genetique du gene SR-p70 caracterisee en ce qu'elle utilise au moins une 
sequence nucl6otidique selon I'une quelconque des revendications 6 a 8. 



32. M6thode de determination d'une variabilite allelique du gene SR-p70 au niveau 
de la position -30 et -20 par rapport * I'ATG d initiation de I'exon 2 pouvant etre 
impliquee dans des pathologies et caracterisee en ce qu'elle comprend au moins: 

- une etape au cours de laquetle on precede * ('amplification par PCR de Texon 2 
du gene SR-p70 portant la sequence cible a I'aide de couple d'amorces 
oligonucieotidtques selon Tune quelconque des revendications 6*8; 

- une etape au cours de laquelle on precede au trartement des produits amplifies 
P ar un enzyme de restriction dont le site de coupure correspond a I'alieie 
recherche; 

- une etape au cours de laquelle on precede £ la detection ou au dosage d'au 
moins Tun des produits de la reaction enzymatique. 



33. Composition pharmaceutique comprenant, e titre de principe actif. un polypeptide 
selon I'une quelconque des revendications 1 & 4. 
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34. Composition pharmaceutique selon la revendicatron precedente, caracterisee en 
ce qu'elle comprend un polypeptide selon la revendication 2. 

35. Composition pharmaceutique contenant un inhibiteur ou un activateur de Tactivite 
5 du SR-p70. 

36. Composition pharmaceutique contenant un polypeptide derive d'un polypeptide 
selon Tune quelconque des revendications 1 a 5 caracterise en ce qu'H est un 
inhibiteur ou un activateur du SR-p70. 

10 
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: TGCCTCCCCGCCCGCGCACCCCCCCCGAGGCCTGTGCTCCTGCGAAGGGG 50 

li III) 

1 GGGCCTCCGGGG 12 

51 ACGCACCCAAGCCGGGGCCCGCGCCAGCCCGGCCGGGACGGACGCCGATC 100 

II I I UNI II I III II I 

13 ACACTTGGCGTCCGGGCTGGAAGCGTGCTTTCCAAGACGGTGACACGCTT 62 

101 CCCGGAGCTGCGACGCCTGCAGAGCGACCTGCCCTCGGAGGCCGGTGTGA 150 

III HI I I II I ft I I I I III I | 

63 CCCTGAGGATTGGCAGCCAGACTGCTTACGGGTCAC . . . TGCCATGGAGG 109 

151 ggaagatggcccagtccaccaccacctcccccgatcxxxxk:accacgttt 200 

I I I I I III III llll I II 111 

110 agccgcagtcagatcccagcatcgagccccctctgactcaggaaacattt 15 9 

201 GAGCACCTCTGGAGCTCTCTGGAACCAGACAGCACCTACTTCGACCTTCC 250 

mi iiii ii i iii i i ii iiii i 

160 TCAGACCTATGGAAACTACTTCCTGAAAACAAC . GTTCTGTCCCCCTTGC 208 
251 CC AGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

, Aa i inn i ii in ii n ii ii i 

209 CGTCCCAAGCGGTGGATGATTTGATGCTCTCTCCGGATGATCTTGCACAA 258 

301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTC 350 

«o 1U I I i I Hill II 

259 TGG TTAACTGAACACCCAGGTC 280 

351 AATTTGCTGAGCAGC AC C ATGGACCAG ATG AGC AG C CGCGCTGCCTCGGC 400 

' 11 1 1 11,(1 ''I 'I H I 

281 CAGATGAAGCTC CCAGAATGTCAGAGGCTGCTCCCCACA 319 

401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 4 50 

„ A mi inn i i n m in i in 

320 TGGCCCCCACACCAGCAGCTCCTACACCGGCGGCCCCTGCACCAGCCCC. 368 

451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 

Ml I I I I I II 
369 CTCCTGGCCCCTGTCATCCTCTGTC 393 

501 CCCTCCAACACCGACTATCCCGGACCCCJVCCACTTCGAGG 550 

_ II HI I I III I III I It III I illi 

394 CCTTCCCAGAAAACCTACCACGGCAGCTACGGTTTCCGTCTGGGCTTCCT 443 

551 GCAGTCCAGCACGGCCAAGTCAGCCACCTOTACGTACTCCCCACTCTTGA 600 

in ii i n ieiiiiii i n n Minimi] \ i i 

444 GCATTCTGGAACAGCCAAGTCTGTGACTTGCACGTACTCCCCTGACCTCA 4 93 
601 AGAAACTCT ACTGCCAG ATCGC CAAGAC ATGCCCCATCC AG ATCAAGGTG 650 

Jnj iii i i ii iii i i i in i iii null i in i in 

494 ACAAGATGTTTTGCCJ^GCTGGCCAAGAXXTGCC 543 
651 TCCGCCCCACCXXXTCCC«aXJ^CCGCCATC^ 700 

_ iJLJ i ii ii n iiii i i 1 1 1 1 1 1 1 1 1 1 i mini 

544 GATTCCACACCCCCGCCCGGCACX^GCGTCCGCGCCATt^ 593 
701 GAAGGCtX5AGCACGTGACCGACATCGTGAAGCGCT^ 750 

LILX. 11111 1,11 11 i' 11 " 1 1 1 1 1 1 1 1 1 1 mi llll 

594 CCAGTCACAGCACATGACTGAGGTCGTGAGGCGCTGCC^ 643 

751 TCGGGAGGGACTTCAACt^AGGACAGTCT^CCCAGCCAC^CACCTCATC 800 

CAA JM HI MM I I I I I I I II 11 II 

644 GCTGCTCAGACAGCGATGGA CTGGCCCCTCCTCAACATCTTATC 687 

801 CCTCTCXgAAGGCAATAATCTCTCGCACTATGTGGACGACCCTGTCA 850 

, fto J] iiiimi in i i inn in m in 

S88 CGAGTOGAAGGAAATTTGCGTCrrGGACTATTCGGATGACAGAAACACTTT 737 

851 CAGGCAGAGCGTCGTGGTGCCCTATGAGCCACCACAGGTGGGGACAGAAT 900 | I U . 

-r« wiJi i mi i ii ii iiii i ni II II II I II Ml I II I 

73 8 TCGACATAGTGTGGTGGTGCCCTATGAGCCGCCTGAGGTTGGCTCTGACT 787 



WO 97/28186 



PCT/FR97/00214 



2/36 



901 TCACCACCATCCTGTACAACTTCATGTGTAACAGCAGCTGTGTGGGGGGC 9 SO 
786 ^iMl^U^.J-iJ-iiJiJliiiililliJ IJi-JilijTf 



GTACCACCATCCACTACAACTACATGTCTAACAGTTCCTGCATGGGCGCC 



837 



951 ATGAACCGACGGCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 1000 

I I t I I I ! ! II Mil llllll II Mill til II 1000 

838 ATGAACCGGAGGCCCATCCTCACAATTATCACACTGGAAGACTCCAGTGG 887 
1001 GCAGGTCCTGGGCCGCCGGTCCTTCGAGGGCCGC^ 1050 

88 8 TAATCTACTGGGACGGAACAGCTTTGAGGTGCG 937 
1051 GCCGCGACtTGAJULAX5CCGATCAGCACCACTACCG<MAGCAGCAGGCCTTG 1X00 

ono I I I II M I II 1 1 II I I 1 1 I 

938 GG AGAG ACCGGCGC ACAG AGGAAG AGAATTTCC a 971 

1101 AATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

a „ J 11 l; 1*1 I I MUM f I M I 

97 2 C AA G AAAGGGG AG CCTTGCC ACG AGCTGCC C C C TGGGAGC ACT AAGCG AG 1021 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCC . GGX5TGTGAAGAAGCGGCGG 1199 

102 2 CACTGCCCAACAACACCAGCTCCT^ 1071 

1200 CACGGAGACGAGCACACGTACTACCTGCAGGTGCGAGGCCGCGAGJLACTT 1249 

,„„ 11,1,1 ' "I III Ml I II II If IMMI 

107 2 GATGGAGAATATTTCAC CCTTCAGATCCGCGGGCGTGAGCGCTT 1115 

12 50 CGAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTGATGGAGTTG^TGC 1299 

iiJiJl L MIIMI III I Mil II Mil 



1157 



iJUJMJ~ ' MIIMI III I fill If I II 

1116 CGAGATGTTCCGAGAGCTGAATGAGGCCTTGGAACTCAAGGA 

1300 CGCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGG 134 9 

11co I' M M I II I I III I Mill 1 1 Ml 

1158 TGCCCAGGCTGGGAAAGAGCCAGCGG . . GGAGCAGGGCTCACTCCAGCCA 1205 

13 50 CCGAGTCACCTACAGCCCCCATCCTACGGGCCG<S 1399 
12 06 CCTGAAGTCCAACAAGGGGCAATCTACCTCCCGCCATAAAAAATTCATCT 1255 

14 00 CAAGGTGCACGG<^GCGT^AACAAGCTGCCCTCCGTCAACCAGCTG<»TGG 14 49 

12 56 TCAAGACAGAGGGGCCTGACTCAGACTGAC TCAGCTTCTTG 1300 

1450 GCCAGCCTCrcCCGCACAGC^G<X»GCTACACCCA^ I499 

1301 «icoALii«acy««^^ l349 

1500 GCXrrCTGOGATCCTCW^AACCACCO:CACCCAGTOCCAOCCAACAax» 1549 
I llllll I III I II ill | || ID | 

13 50 AGTTCTGGGTCTTTAAACC C 1 ' lU.r A^ AATACGTCTM VWa MaUKICAA 1399 

1550 CATGACCAGCAGCCACGGCACCCACTCCAT«?rCTC GC GCTCCCACTCCA 1599 
1400 * 1400 
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1 MAQSTTTSPDGGTTFEHLWSSLEPDSTYFDLPOSSRGNNEWCGTDSSMT SO 

..|:::..:|. :| :.|: || . .:|| : . .:| 

1 KEEPQSDPSIEPPLS QETFSDUrfKLLPENNVLSPLPSQAVD 41 

51 VTHLEGMTTSVMAQFTJLLSSTMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

= I =lh ••• |: I-- .|-.||-.|. -| : 

42 DLKL. . .SPDDLAQWLTEDPGPDEAPRMSEAAPHMAPTPAAPTPA.APAP B7 

101 OPSSTFDTMSPAPVIPSNTDYPGPHHFEVTFOQSSTAKSATWTYSPLLKK 150 
It--: :||...|.|.- I :.| = I ^ 1 I 1 I - < MM I - I 

88 APSWPL SSSVPSQKTYHGSYGFRLGFLHSGTAKSVTCTYSPDLNK 13 2 

151 LYCOIAKTCPIQIKVSAPPPPCTAIIU^innnUCAEHVTDIVKRCPNHELG 200 

: : I I = I I I I I : I : . I . • - I I II • : I I I = = ! I • - : I = I : = I = I I I = 1 I 
133 KFCOLAKTCPVQLWNTOSTPPPGSRVRAMAIYKQSQHMTEVVRRCPHHE. . 180 

201 RDFNEGQS APASHL I RVEGNNLSQYVDDPVTGRQSWVPYEP PQVGTEFT 250 

i - th llllllll I II- I i:||ll)||||:||.: I 

181 RCSDSDGLAPPOHLIRVEGNLRVEYSDDRNTFRHSVVVPYEPPEVGSDCT 23 0 

251 T IL YNFMCNSSCVGGMNRRP I LI I ITLETRDGOVLGRRSFEGRICACPGR 300 

II i I I Mil hi I I II I II I II M I-- I- Mil- ML Ml Mtl 
231 TIHYNYMCNSSCMGGMMRRPILTIITLEDSSGNLLGRNSFEVRVCACPGR 280 

3 01 DRKADEDHYREQQ AllfES S AKNG AASKRAFKQS P P AVP ALG PGVKXRAHG 350 

||:.:| = : :|... =.: . .:..|||: |- .|::. 

281 DRRTEEENFRKKG . . EPCHELPPGSTKRALPHNTS5SPQ PKXKPL 323 

351 DEOTTYLQVRGRENFEIl^QCLKESLEIJtELVPQPLVDSYllQQQOLLQRPS 400 

I:: : I I : I I I I - I h • • • t • I • I I I • = L= I---- 

324 DGEYFTLQIRGRERFEMFRELNEALELJCDAOAGKEPAGSRAHSSHLKSKK 37 3 

401 HI^PPSYGPVLSPMNia^GGVNKl-PSVNOLVGOPPPHSSAATPNLGPVGS 4 50 

374 GQSTSRKKKFKFKTEGPDSD 393 



FIG. 2 



4/36 



1 TGCCTCCCCGCCCCCCCACCCGCCCCGAGGCCTCTGCTCCTGCCAAGGGG 50 

i 4"JULJJUUU"U » JULJUL 1 1 1 1 1 1 ii ii i n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i 

1 TGCCTCCCCGCCCGCGCACCCGCTCCGAGGCC^ 50 
51 A CC<^<*CGAAGCaaXXK^^ 100 

_ Mill Ii II I! (1(1 1| 1 1 1| || IMIIMllMI IHHIItll Hill 

51 ACGCAGCGAAGCCCXX^CCGCGCCAGGC^ 100 
101 CCCGGAGCTCCGACCCCTGCAGAOCGAGCTGCCCTCGGAGGCCCGTGTGA 150 

1 1 1 it mum inn iiiiiiiiiiiiiiiii f iiiiiMiiiiiiiii 

101 CCCGGACCTGCGACGGCTCCAGACCGAGCTGCCCTCCGACGCCGC»rCTGA 150 
151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGCCACCACGTTT 200 

K1 JMI M I IMJLJL' * III 1 1 N 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

151 GGAAGATGGCCCAGTCCACCACCACCTCCCCCGATGGGGGCACCACGTTT 200 
201 CAGCACCTCTGGAGCTCTCTGCAACCAGACAGCACCTACTTCGACCTTCC 250 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 } 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mil | 

201 GAGCACCTCTGGAGCTCTCTTO^ 2S0 
251 CCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCXGCA 300 

XJ^IJL4.JL ' IJLJL * J I * 1 1 * ( » 1 1 i I I I I I I I ! t i I I I f I I I i I I I I t I t I 1 I 

251 CCAGTCAAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGArrCCAGCA 300 
301 TGG ACGTCTTCCAC CT AG AGGGCATGACCACATCTCTC ATCi^CCAGTTC 3 50 

mi JiliiUULLUI 1 M M 1 1 1 1 ) 1 1 M M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 

301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAG'TTC 350 
351 AATTTG CTG AGC AGC ACCATGGACCAG ATGAGCAGCCGCGCTGCCTCGGC 400 

, c IHIMMIIIIIIflllMIIIIIIillllllliiifiiiiiijjiHi 

351 AATTTGCTGAGCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGOC 400 
401 CAGCCCGTACACCCCGGAGCACGCCGCCAGCGTGCCCACCCATTCACCCT 450 

_ MM MM Mil llll II linillllll jlillll III II lllill II I 

401 CAC^CCGTACACCCCCK^GCACGCCGCCACCGTC^ 450 

451 ACGCACAGCCCAGCTCCACCrrTCGACACCATXriTXXXrCGC 500 

451 ACGCACAGCCCAGCTCCACCTTCGACACCATGTCGCCCGCGCCTGTCATC 500 

501 CCCTCCAACACCGACTATCCCGGACCCCACCACTTCGAGGT^ 550 

Cfl1 ii iiii ii it m mm m mi iiiiiiiin m 1 1 1 mini i ii 1 1 1 

501 CCCTCCAACACCGACTATCCCC<^CCCAC^ 550 
551 ,GCAGTCCAGCACGGCCAAGTCAGCCACCTG<^CGTACTCCCCACTCTTGA 600 

iiiiiiii'iHiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiinii 

551 GCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTCA 600 
601 AGAAACTCTACTGCCAGATCGCCAAGAOtt^^ 650 

fini iJL iliJLUi 'JLUJU 1 • m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

601 AGAAACTCTACTGCCACATCGCCAAGACATGCCCCA 650 
651 TCCGCCCCACCGCCCCCC<XX^CCGCCATCCGCGCCATG^ 700 
651 TCCGCCC£ACCGCCCCCGG<reACCOCGATCCGC^ 700 

7 0l GAAGGCGGAGCACGTGACCGACATCGTGAAGCGCTGCCCC 750 

, A INIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII^ 

701 GAAGGCGGAGCACGTGACCGACATCGTGAAOCGCTO 750 

751 TCGGCAGGGACTTCAACGAAGGACAGTCTGCCCCAGCCAGCCAC^ 800 

, I Hill II llll II II II I IIIIIIIIIIIIIIIII II IIIIIIIIN I I 

7S1 TCGGG AGGG ACTTCAACGAAGGACAGTCTGCCCCAGCCAGCC ACCTCATC 800 

801 CCTGTGCAAGCCAATA A TCTCTCC O Un'ATC^ 850 

1 1 i M 1 1 1 1 1 1 II M M I II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 II I i 1 1 M I 

801 CGTGTGGAAGGCAAT AATC TCTC GC AGfT ATGTGGACGACCCTGTCACCGG 850 
851 C AGGC AG AGCGTCGTGGTGCCCTATCAGCCACCAC AGGTGGGGACAGAAT 900 

I IMIIMMII llll II IIIIMIIII llll II II lllllinilll II 

851 CAGGCAGAGCGTCGTGGTGCCCTATOACCCACCACAGGTGGGGACAGAAT 900 
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951 



901 TCACCACCATCCTGTACAACTTCATGTGTAACACCAGCTGTCTGGGGGGC 950 

om ill'IIMIIIIIIMIIIIIIIIIIMIIIIIIIIIIIIIIIIIIIIli 

901 TCACCACCATC^TCn*ACAACTTCATGTGTAACACCACCTGTG^rCGGXK»GC 950 
951 ^J^^^^^GACX^CCCATCCTCATCATCATCACCCTGGAGACCCCGGATCG 1000 

IHIMMIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIflllllll 

ATGAACCCACCCCCCATCCTCATCATCATCACCCTGGAGACGCGGGATGG 1000 
1001 GCAG^TCCTGCXjCCGCCGXn'CCTTCGAGGGCCGC^ 1050 

mm JLJL'JLJUJULiJL 1 1 I I I M I I I I III I I I I I I I | I I | | | | | | | | | | | | | | | | 

1001 GCAGGTGCTGKMCCGCCG^n'CCTTCGAGKX^CGCATCTGCGCCTCTCCTG 1050 
1051 GCCGCGACCGAAAAGCCGATGAGGACCACTACCGGGAGCAGCAGGCCTTG 

inci IMMMIIIIMIIIinillllMMIIIIIIIIIIIIIIIIIIIIM 

1051 GCCCCGACCGAAAAGCCGATGAGGACCACTACCGGCAGCAGCAGGCCTTG 1100 



1100 



1101 



1150 



AATGAGAGCTCCCCCAAGAACGGGGCTGCGAGCAAGCGCGCCTTCAAGCA 
lini ilJiiiiJ. * I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | 
1101 AATGAGACCTCCGCCAAGAACCCGGCTGCCAGCAAGCGCGCCTTCAAGCA 1150 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 

JLI JLLUUUUL I » I I I I I I I I I I I I I I I I I I I I I | I I | | I | | | | | | | | | | | | 

1151 GAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 
12 01 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTC 1250 

)>)><llllllllill!llj|||||||||(||||||||||||||t||||| 

1201 ACGGAGACGAGGACACGTACTACCTGCAGGTGCGAGGCCGCGAGAACTTC 1250 
12 51 GAGATCCTGATGAAGCTGAAGGAGAGCC^GGAGCTGATGCAGTTGGTGCC 1300 

JLlJliiJUUJL 1 JLX ■ ■ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 1 1 1 j 1 1 

GAGATCCTGATGAAGCTGAAGGAGAGCCTGGAGCTTGATGGAGTTGGTGCC 1300 



1251 



1350 



1301 GCAGCCGCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 

,mi iJLiJLJLJULJLUJLi 1 1 1 1 1 1 1 1 1 1 1 1 1 1 m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 m 1 1 1 

13 01 GCAGCCCCTGGTAGACTCCTATCGGCAGCAGCAGCAGCTCCTACAGAGGC 13 SO 



1351 



1400 



i i <i ^LLUiJlLi 1 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | 
13 51 CGAGTCACC^ACAGCCCCCATCCTACG^^CGCTCCTCTCGCCCATGAAC 1400 

1401 ' A ^^p^ a ^^^^GGGGSGCG7PG^AC AACCTGCC CTCOGTCAAC CAGCTOG>7GGG 1450 

UA1 iiiLLUilLU 1 m 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1401 AAG<#TGCACGGGGGCGTGAACAAX5CTGCCCTCCGTCAACCAGCTGGTGGG 14 50 



1451 CCAGCCTCCXrCCGCACAGCTCGGCAGCTACACCCA^ 

,«i ^UUUiillU' ' 1 1 1 1 1 1 1 1 1 1 1 1 1 1 / 1 1 1 1 1 1 1 1 1 1 1 1 1 II! I 1 1 

1451 CCAGCCTCCCCCCCACAGCICGGCAGCrACJtfrCCA^ 



1500 



1500 



1550 



1501 cercrxxx^TGora^CAAcc^ 

, *«, .U'j 'U' 1 1 1 1 1 1 H 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1501 GCTCTCTOATGCTCAACAACCACt^ 1550 



1551 ATGACCAGCAGCCACGGCACCCAGTCCAT 

UC1 iliii' I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1551 ATGACCAGCAGCCACGGCACCCAGTCCAT 

1601 



ACTGCAC 1600 

III I I Ml I I II I I 

KCTGCAC 1600 



TCCGCCACCCCCCTACCACCCCGACCCCAGCCT^ 1650 

lfini IMIMHIMIIIIIIIIIIIIIIIIIIIIIIIIII 

1601 TCTCCCACCCCCCTACCACGCCTACCCCACCCTCGTC 1637 



1701 AGCATTTACCACCTGCACAACCTCACCATCGAGGACCTG^ 1750 

f II I I I IMIII I I II II I 
1^38 AGGACCTGC G GGCCCTGAA 1656 



17 51 GATCCCCGACCAGTATCGCATGACCATCT GG CGGGCCCTX^ACGACCTGA 

Ml 1 1 II II INI II II llllllfl || || IIMIIII lllllltllllll 



1800 
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1657 GATCCCCGAGCAGTATCC^ATGACCATCTCGCCGGGCCTGCAGGACCTGA 1706 
1801 AGCAGCGCCACGACTACGGCCCCGCCGCrc iflSQ 



AACGCGGCCGCCATTTCCATCGGCGGCTCCGGGC AGCTGC AG CGCCAG CG 



1806 



1901 CCTCAraAGGCCCnXJCAOTC^^ 1950 

la-. JUL "Jli I » ' N 1 1 1 1 1 1 1 1 1 1 I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i| | it 1950 

1807 GCTCATCXSAGGCCGTGCACTTCCGCGTGCGCcAcAc^ 18S6 
1951 ACCGCGGCGG^CCCGGCGCCGGCCCCGACGAGTGGGCGXJACTTCGGCTTC 2000 

iJUJUUJL J 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 mil mm 

ACCGCGCCe^CCCGCCGCCGXXrcCCGACGAGT^^ 



1857 



1906 

2001 CACC^CC<^CTGCAArc 2050 

, m-t 1 1 1 JJi 1 J I 1 1 M 1 1 II 1 1 1 M I M I N 1 1 1 M I M M M 1 1 M I III 1 1 

1907 GACCTCCCCCACTGCAAGGCCCGC^ 1956 
2051 GGAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGCCTGTGCCACC 2100 

• I I lllllft 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 MM? I m I 

1957 GGAGGCCGAGATCCACTGAGGGGCCGGGCCCAGCCAGAGC 2006 
2101 GCCCAGAGACCCAGGCCGCCTCGCTCTC 212 8 

M 1 1 II II 1 1 If II M 1 1 M M 1 1 M M 

2007 GCCCAGAGACCXJWXXrCGCCTCGCTCTC 203 4 
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l 
61 
121 
-10 



TGCCTCCCCGCCCGCGCACCCCCCCCGAGGCCTGTCCTCCTGCGAACX^ACGCAGCGAA 6 0 

GCCGGGGCCCGCGCCAGGGCGGCCGGGACGGACCCCGATGCCCGGAGCTGCGACGGCTGC 120 

AG AGCGAGCTCCCCTCGG AGGCCGGTGTGAGGAAGATGGCCC AGTCCACCACCACCTCCC 180 

1 8 1 CCGATGGGGGCACCACGTTTGAGCACCTCTGGAGCTCTCTGGAACCAGAC 2 4 0 

10 DGGTTFEKLWSSLEPDSTYF 29 

24. TCGACCTTCCCCAGT^AAGCCGGGGGAATAATGAGGTGGTGGGTGGCACGGATTCCAGCA 300 

30 D LPQSSRGNNEVVGGTDSSM 49 

301 TGGACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTCAATTTGCTGA 360 

50 DVFHLEGMTTSVMAQFNLLS 69 

3 o 1 GCAGCACCATGGACCAGATGAGCAGCCGCGCTGCCTCGGCCAGCCCGTACACCCCGGAGC 4 2 0 
70 STMDQMSSRAASAS PYTPEH It 

4 :i ACCCCGCCAGCGTGCCCACCCATTCACCCTACGCACAGCCCAGCTCCACCITCGACA^^ 460 

90 AASVPTHSPYAQPSSTFDTM 109 

4 81 TGTCGCCCGCGCCTGTCATCCCCTCCAACACCGACTATCCCGGACCCCACCA 540 

S P APVI PSNTDYPGPHKFEV 129 

541 TCACTTTCCAGCAGTCCAGCACGGCCAAGTCAGCCACCTGGACGTACTCCCCACTCTTGA 600 

130 TFQQSSTAKSATWTYSPLLK 149 

601 AG AAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 660 

Jf?* LYCQlAKTCPI QIXVSAPP 169 

661 CGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAAGAAGGCGGAGCACGTGACCG 720 

-.70 PPGTAIRAMPVYKKAEHVTD 189 

' lz ACATCGTGAAGCGCTGCCCCAACCACGAGCT^GGGAGGGACTTCAACGAAGGACAGTCTG 780 

190 IVKRCPNHELGRDFNEGQSA 209 

791 CCCCAGCCAGCCACCTCATCCGTGTGGAAGGCAATAATCTCTCGCAGTATGTGGACGACC 840 

210 P ASHLIRVEGNNLSQYVDDP 229 

841 CTGTCACCXXX^AGGC AG AGCGTCGTGGTGCCCTATGAGCCAC CAC AGGTGGGGACAGAAT 900 

230 VTGRQSVVVPYEPPQVGTEF 249 

901 TCACCACCATCCTGTACAACTTCATGTGTAACAGC o 60 

250 TTILYNFKCNSSCVGGKMRR 269 

961 GGCCCATCCTCATCATCAraCCCTGGAC^ 10 20 

270 P I L I I ITLETRDGQVLGRRS 289 

1021 CCTTCGAGGGCCGCATCTGCGCCTGTCCTGt^GCGACCGAAAAGC^ 108 0 

290 F E G R I C A CPGRDRKADEDHY 309 

1081 ACCGGGAGCAGCAGGCCTTGAATGAGAGCTCCGCCAAGAACGGGGCTGCCAGCAAGCGCG 1140 

310 REQQALNESSAKNGAASKRA 329 

1141 CCTTCAAGCAGAGTCCCCCTGCCGTCCCCGCCCTGGGCCCGGGTGTGAAGAAGCGGCGGC 1200 

330 FKQSPPAVPALG PGVKKRRH 349 

1201 ACGGAGACGACCACACCTACTACCTGCAGGTGCGAGCCCGCGAGAA 12 60 

350 GDEDTYYLQVRGRENFEILM 369 

TOAAGCTGAAGGACAGCCTWAGCTGATG^AG^ 1320 

370 KLKESLELMELVPQPLVDSY 389 

1321 ATCGGCAGCAGCAGCAGCTCCTACAGAGGCCGAGTCACC^ 13 80 

,22? * g--9 Q QLLQRPSHLQPPS Y" G P 409 

1381 CGGTCCTCTCGCCCATGAACAAGGTGCACGGGGX^GTGAACAAGCTGCCCTCCGTCAACC 1440 

410 VLSPMNKVHGGVNKLPSVNQ 429 

1441 AGCTCGiPG«^AGrCTCCCCCGCACAGCT 15oo 

430 t.VGQPPPHSSAATPNLGPVG 449 



1501 



-w. GC ^CTGGGATGCTCAACAACCACGGCCACGCAGTGCCAGCCAACAGCG AG ATG ACC AGCA 1560 

450 SCMLNNHGHAVPANSEMTSS 469 

X lnn ^5 ACG ^<^CAGTCCATGG IX. ^i^'KCCACTGCACTCCGCCACCCCCCTXCCACG 1620 

470 HGTQSMVSGSKCTPPPPYHA 489 

1S A H CCGACCCCAGCCTCGTCAGTTTTTTAACAGGATTG^ 1680 

490 DPSLVSFLTGLGCPNCIEYF 509 
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16 81 TC ACGTCCC AGGGCTT ACAGACCATTTACC ACCTCCACAACCTCACC ATCG AGGACCTGG 1740 
510 TSQGLQSIYHLQNLTIEDLG S29 

17 41 GGGCCCTGAAGATCCCCGAGCAGTATCGCATGACCATCTGGCGGGCCCTGCAGGACCTGA 1800 
530 A LK I PEQYRMTIWRGLQDLK 549 

1801 AGCAGGGCCACGACTACGGCCCCGCCGCGCAGCAGCTGCTCCGCTCCAGCAACGCGGCCG 1860 

550 QGKDYGAAAQQLLRSSNAAA 569 

1 8 6 1 CCATTTCCATCGGCGCCTCCGGGGAGCTGCAGCGCCAGCGGGTCATGGAGGCCGTGCACT 192 0 
5*?0 I S t CGSCELQRQRVMEAVHF 589 

19 21 TCCGCGTGCGCCACACCATCACCATCCCCAACCGCGGCGGCCCCGGCGCCGGCCCCGACG 1980 
590 RVRHTITIPNRGGPGAGPDE 609 

1981 AGTGGGCGGACTTCGGCTTCGACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGG 2040 

610 WAD .FGFDLPDCKARKQPIK E 629 

2041 AGGAGTTCACGGAGGCCGAGATCCACTGAGG^G^CGGGCCCAGCCAGAGCCTGTGCCACC 2100 

630 EFTEAEIH* 649 

2101 GCCCAGAGACCCAGGCCGCCTCGCTCTCCTTCCTGTGTCCAAAACT^ 2160 

2161 GGCCTCCAGGCTCTGCCCGGGGAAAGGCAAGGTCCGCCCCATGCCCCGGCACCTCACCGG 2220 

2221 CCCCAGGAGAGGCCCAGCCACCAAAGCCGCCTGCGGACAGCCTGAGTCACCTGCAGAACC 2280 

22 81 TTCTGCAGCTGCCCTAATCCTGGCCTTGCGGGGCAGGGG^ 2340 

2341 CACTGCCGGGCGTGCTCCATGGCAGGCGTGGGTGGGGACCGCAGTGTCAGCTCCGACCTC 2400 

2401 C AGG CCTC ATC CT AG AG ACTCTGTC ATCTGCC G ATC AAGC AAGGTCCTTCC AGAGGAAAG 2460 

2461 AATCCTCTTCGCTGGTGG ACTGCCAAAAAGTATTTTGCGACATCT^ 2 520 

2521 TGGTGAGCAGCCAAGCGACTGTGTCTGAAACACCGTGCATT^ 2 S80 

2581 GGOCTGGTCACTCTCTCTGCIK*^CTTGG 2640 

2 641 TGCGGG AC CGCCTC CTTC CTGCtXXTT AAC AACC ACC AAAGTGTTGCTGAAATTGGAG AAA 2700 

2701 ACTGGGG AAGGCGCAAC CCCTCCCAGGTGCGGG AAGCATCTGCT ACCGCCTCGGCCAGTG 2760 

2761 CCCCTC AGCCTG<^CACAGTCACCTCrcCTTG<*GGAAC CCTGGGCAGAAAGGGACAGCCT 2820 

2821 GTCCTTAGAGGACCGGAAATTGTCAATATTTGATAAAATGATACC ClM * l " lvr AC 2874 
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1 TG C CTCCCCGCCCCCCCACCCGCCCCGAGGCCTGTOCTCCTGCGJUUXX^ 6 0 

6 1 GCCCGGGCCCGCCCC^CGCCC^CGOCUCGGACCKraSATGCCCCGAOCT^ 12 0 

121 AGAGCCAGCTGCCCTCGGAGGCCGGTGTGATCAAGATCX^CCAGTCCACCACCACCTCCC 180 



181 CCG ATGGGGGC ACCACGTTTGAGCACCTCTTK3AGCTCTCTGGAACCAGACAGCACCTACT 240 



30 DLPQSSRGNNEVVGGTDSSM 49 

3 0 1 TG^ACGTCTTCCACCTAGAGGGCATGACCACATCTGTCATGGCCCAGTTCAATTTGCTGA 360 

50 DVFHLEGMTTSVMAQFNLLS 69 

3 61 GCAGCACC ATGG ACC AGATGAGCAGCCC^GCTGCCTCGGCCAGCCCOTACACCCCGG AGC 420 
70 STMDQMSSRAASASPYTPEH B9 

4 21 ACGCCGCC AGCGTGCCCACCCATTCACCCTACC^CAGCCCAGCTCCACCTTCGACACCA 480 
90 AASVPTHSPYAQPS5TFDTM 109 

4 81 TGTCG CCCGCGCCTGTC ATCCCCTCCAACACCG ACT ATCCCGG ACCCC ACC ACTTCG AGG 540 

110 SPAPVIPSNTDYPGPHHFEV 129 

541 TCACTTTCCAGCAGTCCACCACGGCCAAGTCAGCCACra 600 

130 TFQQSSTAKSATWTYSPLLK 149 

601 AGAAACTCTACTGCCAGATCGCCAAGACATGCCCCATCCAGATCAAGGTGTCCGCCCCAC 660 

150 KLYCQIAKTCPIQIKVSAPP 169 

6 6 1 CGCCCCCGGGCACCGCCATCCGGGCCATGCCTGTCTACAAGAAGGCGCAGCACGTGACCG 7 20 
1"0 P PGTAI RAM PVYKKAEHVTD 189 

7 2 1 ACATCGTGAAGCGCTGCCCCAACCACX5AGCTCGGGAGGGACTTCA 7 80 
190 IVKRCPNHELGRDFNEGQSA 209 
7 81 C C C C AG CC AGCC ACCTCATC CGTGTGG AAGGCAAT AATCTCTTCGCAGT ATGTGG ACG AC C 840 
210 PA5HLI RVEGNNLSQYVODP 229 
841 CTGTCACaSCCAGGCAGAGCOTCGTGCTGCCCT^ 900 
230 VTGRQSVVV PYEPPQVGTEF 249 
901 TCACCACCATCCTGTACAACTTCATGTG^AACAGCAGCTGTGTGGGGGGCATG 960 
250 TT ILYNFMCNSSCVGGHNRR 269 
961 GGCCCATCCTCAT^ATCATCACCCTGGAGACGCGGGATGGGCAGGTGCTGGGCCGCCGGT 1020 
270 P I LI I ITLETRDGQVLGRRS 289 

1021 CCTTCGAGGGCCGCATCTGCGCCTGTCCTGGCCGCGACCX5AAAA 1080 

290 FEGRICACPGRDRKADEDHY 309 

1081 ACCGGCAGCAGCAGGCCTTGAATGAGAGCTCCGCCAAGAACGGGGCTGCCA 1140 

310 REQQALNESSAKNGAASKRA 329 

1141 CCTTCAAGCAGAGTCCCCCrC^OTTXXXXGCCCTGG 1200 

330 FKQSPPAVPALGPGVKKRRH 349 

1201 ACGC AG ACG AGGAC ACCT ACT ACCTGCAGCTGCGAGGCCGCG AG AACTTCGAGATC CTG A 1260 

350 GDEDTYYLQVRGRENFEILM 369 

1261 TGAAGCTGAAGGAGAGCCTGGAGCTGATCGAGTTGGTGCCG 1320 

370 KLKESLELMELVPQPLVDSY 389 

13 21 ATCGGCAGCAGCAGCAGCTCCTACAGAGGCCGAGTCACCTACAGCCCCCATCCTACGGGC 1380 

390 ROQQQLLQRPSHLQPPSYGP 409 

13 81 CGGTCCTCTCGCCCATGAACAAGCTGCACGGCGGCGTGAACJUWGCTGCCCTCCGTCAACC 1440 

410 VLSPMNKVKGGVMKLPSVNQ 429 

1441 AGCTGCTGCttCCACCCTCCCCCGCXCAGCTCXJGCAGCT 1500 

430 LVGQPPPHS SAATPNLGPVG 449 

1501 GCTCTGGGATGCTCAACAACCACGGCtlACGCA<rPGCCAGCC^ 1560 

450 SGMLNHRGRAVPANSEKTSS 469 

1561 GCCACGGCACCCAGTCCATGGTCTOXXX?^ 1620 

470 HGTQSMVSGSHCTPPPPYHA 489 

1621 CCOACC<:CAG<^rrCGTCAGGACCTCG<Xk^ 1680 

490 DFSLVRTWCP* 509 

1681 C^TCTOGCGGCGCCTGCAGGACCTGAAGC^ 1740 

1741 GCTGCTCtXXrrct^X^CWJGCCC^ 1800 

1801 CCAGCX5GGTCATGGAG<XrCt*rGCACTTCCX3CGTGCG I860 

1861 CGGCGGCCCCGGCQCXXX^Ca^U^ACTGta^^ 1920 

1921 CAAG<XXXXCAAGCAGCCCATCAAGGAG<5AGTT^ 1980 

1981 CGGCCCC AGCC AG AGCCTGTGC^ACCGCCCAGAG AC CCAGGCCGCCTCGCTCTC 2034 
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60 
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MAQSTATS PD 


10 
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^ ^ A * *■•« — W -»SLE PDSTYFD 


30 


121 
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180 


3 1 


r y -> -K_NNEVVGGT DSSMD 


50 


181 
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51 
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70 
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71 
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110 
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111 
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421 
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480 


131 


* UOSSTAKSATWTYSPLLKK 
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481 
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540 
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170 
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211 


m_» n._ i KVEGNNL SQYVDD PV 


230 


721 


A v - n, - , -w-t_uuA_A_u_ _v-Kj i^aCCCTATGAGCCACCACAGGTGGGGACGGAATTCA 


780 


231 


— ^v-vvvpyEPPQVGTEFT 


250 


781 


it- - ii_ i alaal TTUATGTGTAACAGCAGCTGTGTAGGGGGCATGAACCGGCGG c 


840 


251 


T* T T . V M _? UTS* — — <-> mm _ 

i X LfxNFMCNSSCVGGMNRRP 


270 


841 


lwt 1 1 1 w_t. t. L. Tl_K_AG ATGCGG G ATGGGCAGGTG C TG GG CCGC C GG T CC T 


900 


271 


j._ _. n >*\-Jv»yVLGRRSF 


290 


901 


TTGAGGGCCGCATCTGCGCCTGTCCT<W3CCGCGACro 


960 


291 


EGRICACPGRDRKADEDHYR 


310 


961 


GGGAGCAGCAGOCCCTGLAACGIAGAGCTCCGCC^ 


1020 


311 


EQQALNESSAKNGAASKRAF 


330 


1021 


TCAAGCAGAGCCCCCCTGCCGTCCCXGCCCT^^ 


1080 


331 


KQSPPAVPALGAGVKKRRHG 


350 


1081 


GAGACGAG^CACCTACTACCTTCAGGTGCGAGG 


1140 


351 


DEDTYYLQVRGRENFEILMK 


370 


1141 


AGCTGIAAAGAGAGCCTGGAGCTGATC 


1200 


371 


LKESLELMELVPQPLVDSYR 


390 


1201 


GGCAGCAGCAGCAGCTCCTAC_^GAGGCCGAGTCACCTACAG^^ 


1260 


391 


QQQQLLQRPSHLQPPSYGPV 


410 


1261 


TCCTCTCGCCCATCAACAAGGTGO.CGGG 


1320 


411 


LSPMNKVHGGMNKLPSVNQL 


430 


1321 


TGGTGGGCCAGCCTCCCCCGCACAGTTCGOT 


1380 


431 


VGQPPPHSSAATPNLGPVGP 


450 


1381 


ccgggatgctcaacaaccatggccacgcagtx_k:cagccaacggcg^ 


1440 


451 


GMLNNHGHAVPANGEMSSSH 


470 
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1441 

471 
1501 

491 
1561 

511 
1621 

531 
1681 

551 
1741 

571 
1801 

591 
1861 

611 
1921 

631 
1981 
2041 
2101 



AC AGCGCCCAGTCC ATGGTCTCGGGGTCCCACTGCACTCCGCCACCCCCCTACCACGCCG 1500 

SAQSMVSGSHCTPPPPYHAD 490 

ACCCC AGCCTCGTCAGTTTTTTAACAGGATTGGGGTGTCCAAACTGCATCG AGTATTTCA 1560 

PS LVSFLTGLGCPNC I EY FT 510 

CCTCCCAAGGGTTAC AGAGCATTTACCACCTGCAGAACCTGACCATTGAGGACCTGGGGG 162 0 

SQGLQS IYHLQNLTI EDLGA 530 

CCCTGAAGATCCCCGAGCAGTACCGCATGACCATCTGGCGGGGCCTGCAGGACCTGAAGC 168 0 

LKIPEQYRMTIWRGLQDLKQ 550 

AGGGCC ACGACTACAGCACCGCGCAGCAGCTGCTCCGCTCTAGCAACGCGGCCACCATCT 1740 

GH DYSTAQQLLRS SNAAT I S 570 

CCATCGGCGGCTCAGGGGAACTGCAGCGCCAGCGGGTCATGGAGGCCGTGCACTTCCGCG 180 0 

IGGSGELQRQRVMEAVHFRV 590 

TGCGCCACACCATC ACC ATCCCCAACCGCGGCGGCCCAGGCGGCGGCCCTGACGAGTGGG 1860 

RHTITI PNRGGPGGGPDEWA 610 

CGGACTTCGGCTTCGACCTGCCCGACTGCAAGGCCCGCAAGCAGCCCATCAAGGAGGAGT 1920 

DFGFDLPDCKARKQPI KEEF 630 

TCAC GGAGG CCGAGATC C ACTG AGGGCCTCGCC TGGCTG C AGCCTGCGCC ACCGCCC AG A 1980 

T E A E I K * 650 

GACCC AAGCTGCCTCCCCTCTCCTTCCTGTGTGTCCAAAACTGCCTCAGGAGGCAGGACC 2040 

TTCGGGCTGTGCCCGGGGAAAGGCAAGGTCCGGCCCATCCCCAGGCACCTCACAGGCCCC 2100 
AGGAAAGGCCCAGCCACCGAAGCCGCCTGTGGACAGCCTGAGTCACCTGCAGAACC 2156 




WO 97/28186 



PCT7FR97/00214 



12/36 




K E B F T E T E S H * * *«™TCCTTC 

CTCTGTGAG AAACTGC TCTlXiGAAGTGGGACC TU 1 IIA^ lOl^CVACAGAAACr juv-ax 
^ACCTTCTGCCGGATGCCAT^^ 



559 
I860 
579 
1920 
599 
1980 
2040 
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1 TGGTCCCGCTTCGACCAAGACTCCGCCTACCACCTTGCCCGCCCCGCGGAGGAGGAGACC 60 

6 1 CCGCTGGGCXTTAGCTGGGCGACGCGCGCCAAGCGGCGGCGGGAAGG 120 

121 GGGCCCGAGACCCCGACTCGGGCAGAGCGAGCTGGGGAGGCGGGGCGCGCGTGGGAGCCA 180 

181 GGG<3CCCGGGTGCCCGCCCCTCCTCCGCCAC^CTGAGTGCCCCCGCTC 240 

301 ACCCTTATAACCCCCCGTCCCGCATCCAGGCGAGGAGGCAACGCTGCAGCCCAGCCCTCG 360 

361 C CG ACGCCG ACGCCCGGCC CGGAGCAG AATGAGCGGC AGCGTTGGGGAGATGGCCCAGAC 420 

-8 MSGSVGEMAQT11 

421 CTCTTCTTCCTCCTCCTCCACCTTCGAGCACCICTGGAGTTCT 4 80 

12 SSSSSSTFEHLWSSLEPDST 31 

481 ACTTTG ACCTC CCCC AGCC C AGCCAAGGGACTAGCG AGGCATC AGGCAGCGAGGAGTC 540 

32 YFDLPQPSOGTSEASGSEES 51 

541 CAACATGGATGTCTTCCACCTGCAAGGCATGGCCCAGTTCAATTTGCTCAGCAGTGCCAT 600 

52 NMDVFHLQGMAQFNLLSSAM 71 

601 GGACCAGATGGGCAGCCGTGCGGCCCCGGCGAGCCCCTACACCCCGGAGCACGCCGCCAG 660 

72 DQMGSRAAPASPYTPEHAAS 91 

661 CGCGCCCACCCACTCGCCCTACGCGCAGCCCACCTCCACCTTCGACACCATGTCTCCt^ 720 

92 APTHSPYAQPSSTFDTMSPA 111 

721 GCCTGTCATCCCTTCCAATACCGACTACCCCGGCCCCC 758 
112 PVI PSNTDYPGP 123 
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_ Name: sr-p70a-cos3 

_ Name: sr-p70b-cos3 

_ Name: sr-p70-ht29 

_ Name: sr-p70c -at c20 

_ Name: sr-p70a-att20 



Len : 


650 


Check 


Len : 


650 


Check 


Len : 


650 


Check 


Len : 


650 


Check 


Len : 


650 


Check 



9661 Weight: 1.00 

3605 Weight: 1.00 

85 Weight: 1.00 

4 072 Weight: 1.00 

4204 Weight: 1.00 



1 50 

_ sr-p70a-cos3 KAQ STTTSPDCGT TFEKLWSSLE PDSTYFDLPQ SSRGNNEWG 

_ sr-p7 Ob-cos 3 MAC STTTSPDCGT TFEHLWSSLE PDSTYFDLPQ SSRGNNEWG 

_ sr-p70-ht29 MAO STAT S P DGGT TFEHLWSSLE PDSTYFDLPQ SSRGNNEWG 

_sr-p70c-att20 

_sr-p70a-att20 MSG SVG EMAO . . . TSSSSSS TFEHLWSSLE PDSTYFDLPQ PSQGTSEASG 

51 100 

_ sr-p70a-cos3 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_ sr-p70b-cos3 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_ sr-p70-ht29 GTDSSMD.VF HLEGMTTSVM AQFNLLSSTM DQMSSRAASA SPYTPEHAAS 

_sr-p70c-att20 . . . MCMGPVY . . ESLG. . .Q AQFNLLSSAM DQMGSRAAPA SPYTPEHAAS 

_sr-p7 0a-att20 SEESNMD. VF HLQGM AQFNLLSSAH DQMGSRAAPA SPYTPEHAAS 

Z 101 150 

_ sr-p70a-cos3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAXSATW 

_ sr-p7 Ob-COS 3 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAXSATW 

_ sr-p70-ht2 9 VPTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAXSATW 

_sr-p7 0c-att20 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GPHHFEVTFQ QSSTAXSATW 

_sr-p7 0a-att2 0 APTHSPYAQP SSTFDTMSPA PVIPSNTDYP GP 

I 151 200 

_ sr-p70a-cos3 TYSPLLXXLY CQIAKTCPIQ IKVSAPPPPG TAIRAMPVYK KAEHVTDIVK 

_ sr-p7 Ob-COs 3 TYSPLLXXLY CQIAKTCPIQ IKVSAPPPPG TAIRAMPVYK KAEHVTDIVK 

_ Sr-p70-ht2 9 TYSPLLXXLY CQIAKTCPIQ IKVSTPPPPG TAIRAMPVYK KAEHVTDWK 

„sr-p70c-att20 TYSPLLKKLY CQIAKTCPIQ IKVSTPPPPG TAIRAMPVYK KAEHVTDIVK 

_sr-p70a-att20 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
_sr-p70e-atc20 
_sr-p70a-atc20 



201 250 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSWVPYEP 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSWVPYEP 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL SQYVDDPVTG RQSWVPYEP 
RCPNHELGRD FNEGQSAPAS HLIRVEGNNL AQYVDDPVTG RQSWVPYEP 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
_ sr-p70-ht29 
_sr-p70c-att20 
_sr-p70a-att20 



251 



300 



PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLETRDG QVLGRRSFEG 
PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLETRDG QVLGRRSFEG 
PQ V GTEFTTI LYNFMCNSSC VGGMNRRPIL IIITLEMRDG QVLGRRSFEG 
PQVGTEFTTI LYNFMCNSSC VGGMNRRPIL VIITLETRDG QVLGRRSFEG 



_ sr-p70a-cos3 
_ sr-p70b-cos3 
„ sr-p70-ht29 
_sr-p70c-att20 
_sr-p70a-att20 



301 3S0 

R I CAC PGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGP 

RICACPGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGP 

R I CAC PGRDR KADEDHYREQ QALNESSAKN GAASKRAFKQ SPPAVPALGA 

RICACPGRDR KADEDHYREQ CALNESTTKN GAASKRAFKQ SPPAIPALGT 
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351 



400 



sr-p70a-cos3 
sr-p70b-cos3 
'_ sr-p70-ht29 
_sr-p70c-att2O 
_sr-p70a-att20 



sr-p70a-cos3 
sr-p70b-cos3 
sr-p70-ht29 
_sr-p70c-«tt20 
_sr-p70a.-att20 



GVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR . . 

GVKKRRHGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR. . 

GVKKRRKGDE DTYYLQVRGR ENFEILMKLK ESLELMELVP QPLVDSYR . . 

NVKKRRHGDE DMFYMHVRGR ENTEILMKVK ESLELMELVP QPLVDSYRQQ 



401 



450 



QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 

QQQQLLQRPS HLQPPSYGPV LSPMNKVKGG VNKLPSVNQL VGQPPPHSSA 

QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG HNKLPSVNQL VGQPPPHSSA 

QQQQLLQRPS HLQPPSYGPV LSPMNKVHGG VNKLPSVNQL VGQPPPHSSA 



451 500 

sr-p70a-cos3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 

sr-p7 Ob-COS 3 ATPNLGPVGS GMLNNHGHAV PANSEMTSSH GTQSMVSGSH CTPPPPYHAD 

Sr-p70-ht29 ATPNLGPVGP GMLNNHGHAV PANGEMSSSH SAQSMVSGSH CTPPPPYHAD 

Isr-p70c-att20 AGPNLGPMGS GMLNSHGHSM PANGEMNGGH SSQTMVSGSH CTPPPPYHAD 

_sr-p70a-att20 

501 550 

sr-p70a-cos3 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LKIPEQYRMT 

sr-p70b-cos3 PSLVR. . T . W G . P 

sr-p70-ht29 PSLVSFLTGL GCPNCIEYFT SQGLQSIYHL QNLTIEDLGA LKIPEQYRMT 

Isr-p70c-att20 PSLVSFLTGL GC PNC I EC FT SQGLQSIYHL QNLTIEDLGA LKVPDQYRMT 

Isr-p70a-att20 

~ 551 600 

sr-p70a-cos3 IWRGLQDLKQ GHDYGAAAQQ LLR.SSNAAA ISIGGSGELQ RQRVMEAVHF 

sr-p70b-cos3 

sr-p70-ht29 IWRGLQDLKQ GHDYS.TAQQ LLR. SSNAAT ISIGGSGELQ RQRVMEAVHF 

Isr-p70c-att20 IWRGLQDLKQ SHDCG. . .QQ LLRS SSNAAT ISIGGSGELQ RQRVMEAVHF 

_sr-p70a-atc20 

601 650 

sr-p70a-COs3 RVBHTITIPN RGGPGA . . GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 

_ sr-p70b-cos3 

sr _p70-hc29 RVRHTITIPN RGGPGG.-GP DEWADFGFDL PDCKARKQPI KEEFTEAEIH 

Isr-p70c-att20 RVRHTITIPN RGGAGAVTGP DEWADFGFDL PDCKSRXQPI KEEFTETESH 

_sr-p70a-att20 
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FIG, 10b 

FEUILLE DE REMPL^CEMEMT {REGIE 26) 
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FIG.11 



fBWLLE DE REMPLACEMENT (REGIE 26) 
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1 < I > 2 < | > 3 

I 1 MAQS. .TATSPDGGTTFEHLWSSLEPDSTYFDLPQSSRGNNEWGGTDSSMD 50 

| II I II II I II , || 

^ ^ I ^ 2 MEEPQSDPSVEPPLSQETFS DWl^LLP E N NVLfSP^LP SQAMD 4 1 



51 VFHLEGMTTSVM|\QFNLLSSTMDQMSSRAASASPYTPEHAASVPTHSPYA 100 

I I I II I M I I 

42 DLML . . . SPDDIEQWFTEDPGPDEAPRMPEAAPPVAPAPAAPTPA . A PAP 87 

■ < I > 5 • 

101 QPSSTFDTMSPAPVIPSNTDYPGPHHFEVTFQQSSTAKSATWIpfSPLLKK 150 
M N M I I I I I I I I |.| | | | | 

88 APSWPL SSSVPSOKTYQGSYGFRIX3FLHSGTAKSVTCTOSPALNK 132 

. < ' > 5 

151 LYCQIAKTCPIQIKVSTPPPPGTAIRAMPVYKKAEHVTDWKRCPNHELG 200 

M Mill | t lllll III II I I || IN || 

133 MFCQLAKTCPVQLWVDSTPPPGTRVKAMAIYKQSQHMTEVVRRCPHHE . . 180 

201 RDFNEGQSAPASHLIRVEGNNLSQYTODPVTGRQSVWPYE^C^GTEFT 250 

I M I I I I I I I I 111 I I I I I I I I I | | ,|| | 

181 RC S DSDG LA P PQH L I RVEGNLRVE Y LDDRNT FRHSVW P YE P P EJ/G SDCT 230 

< ' >. g <.| > 6 . <^ > 7. 

251 T I L YNFMCN S SCVGGMNRR P I L 1 1 1 T LEMRDGQVLGRRS FEGR I C AC PGR 300 

II I I J J I I I I llltlllll lllll I III Ml I llllll 

231 TIHYNYMCNSSCMGGMrmRPILTIITL EDS^GNL LGRNSFEVRVCACPGR 280 

301 DRKADEDHYREQQALNESSAKNGAASraAFKQS P PAVPALGAGVKK RRHG 350 

M I I III I | 
281 DRRTEEENLRKKGEPHHELP . . PGSTKRALPNNTSSSPQ PKKKPL 323 

< i > 10 < > 9 < , ■ > 11 

3 51 DEDTYYLQjyTRGRENFEILMKLKESLELMELVPQPLVDSYRQQCJQLLQRPS 400 

I 11,1111 II I MM || 

324 TCEYFTLQjERGRERFEMFRELNEALELKDAQAGKEPGGSRAHSSHLKSKK 373 

< ' > 10 <Ty i >1 , 

401 hlqppsygpvl^pmnkvhggmnklpsvnqlvgqppphssaatpnlgpv4p^4 5 0 
374 gqstsrhkklmfktegpdsd 393 

< I > 13 

451 GMLNNHGHAVPANGEMSSSHSAQSMVSGSHCTPPPPYHADPSLVSFLTGL 500 
501 GCPNCIEYFTSQGLOSIYHLQNL^E^^ALKIPEQYRMTIWRGLQDLKQ 550 
551 GHDYSTAQQLLRSSNAATISIGGSGELQRQRVMEAVHFRVRHTITIPNRG 600 
601 GPGGGPDEWADFGFDLPDCKARKQPIKEEFTEAEIH 636 
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;r-p70d-imr32 C G ACCTTCCCCA GTCAAGCCGG GGGAATAATG 32 

sr-p70a-ht29 C G ACCTTCCCCA GTCAAGCCGG GGGAATAATG 150 

AGGTGGTGGG CGGAACGGAT TCCAGCATGG ACGTCTTCCA CCTGGAGGGC 82 
AGGTGGTGGG CGGAACGGAT TCCAGCATGG ACGTCTTCCA CCTGGAGGGC 200 

ATGACTACAT CTGTCATGCA TCCTCGGCTC CTGCCTCACT AG CTGCGGAG 132 
ATGACTACAT CTGTCAT 217 

CCTCTCCCGC TCGGTCCACG CTGCCGGGCG GCCACGACCG TGACCCTTCC 1B2 



CCTCGGGCCG CCCAGATCCA TGCCTCGTCC CACGGGACAC CAGTTCCCTG 2 32 



GCGTGTGCAG ACCCCCCGGC GCCTACCATG CTGTACGTCG GTGACCCCGC 282 



ACGGCACCTC GCCACGGCCC AGTTCAATCT GCTGAGCAGC ACCATGGACC 332 
GGCCC AGTTCAATCT GCTGAGCAGC ACCATGGACC 2 52 

AGATGAGCAG CCGCGCGGCC TCGGCCAGCC CCTACACCCC AGAGCACGCC 382 
AGATGAGCAG CCGCGCGGCC TCGGCCAGCC CCTACACCCC AGAGCACGCC 302 

GCCAGCGTGC CCACCCACTC GCCCTACGCA CAACCCAGCT CCACCTTCGA 432 
GCCAGCGTGC CCACCCAcTC GCCCTACGCA CAACCCAGCT CCACCTTCGA 352 

CACCATGTCG CCGGCGCCTG TCATCCCCTC CAACACCGAC TACCCCGGAC 4 62 
CACCATGTCG CCGGCGCCTG TCATCCCCTC CAACACCGAC TACCCCGGAC 402 

CCCACCACTT TGAGGTCACT TTCCAGCAGT CCAGCACGGC CAAGTCAGCC 532 
CCCACCACTT TGAGGTCACT TTCCAGCAGT CCAGCACGGC CAAGTCAGCC 452 

ACCTGGACGT ACTCCCCGCT CTTGAAG 
AC C TGGACGT ACTCCCCGCT CTTGAAG 
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documents submitted by the applicant. 

Defects in the images include but are not limited to the items checked: 

□ BLACK BORDERS 

□ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 

□ FADED TEXT OR DRAWING 
-^BLURRED OR ILLEGIBLE TEXT OR DRAWING 

□ SKEWED/SLANTED IMAGES 

□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 

□ GRAY SCALE DOCUMENTS 

□ LINES OR MARKS ON ORIGINAL DOCUMENT 

□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



